Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Versin Preliminar
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Contenido
I.
Introduccin ......................................................................................................................3
II.
Diagnstico: problemas del estimador actual para estadsticas de nivel comunal .....................4
III.
1.
2.
3.
4.
IV.
Implementacin de la metodologa de estimacin en reas pequeas para el caso de las
comunas de Chile .................................................................................................................... 14
1.
2.
3.
4.
5.
6.
......................................................... 25
7.
Y .................................................. 27
8.
9.
10.
11.
12.
Yi ................................................................. 18
i ................................. 27
( Pi SAE ) ................................................................... 29
V.
VI.
Referencias .................................................................................................................. 37
VII.
ANEXOS ................................................................................................................... 41
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
I.
Introduccin
Uno de los objetivos del Ministerio de Desarrollo Social es proveer informacin acerca de la
realidad social y econmica del pas. Para ello, el Ministerio levanta la Encuesta de
Caracterizacin Socioeconmica Nacional (Casen) desde 1987 y ha publicado estadsticas
oficiales de la tasa de pobreza nacional, regional y comunal, utilizando mtodos estndar
para el anlisis de datos provenientes de encuestas complejas. El tipo de estimador utilizado
presenta propiedades deseables para la produccin de estimaciones insesgadas y
consistentes a nivel nacional y regional12. A nivel comunal, sin embargo, la propiedad de
consistencia del estimador se va perdiendo (Cochran, 1977; Lohr, 1999; Srndal et al.,
1992; Rao, 2003).
Durante el ao 2010, el Ministerio de Desarrollo Social convoc a una Comisin de Expertos
con el objeto de hacer una revisin exhaustiva de la Encuesta Casen 3. Una de las
recomendaciones de esta Comisin fue que se utilizaran mtodos ms confiables para la
produccin de estadsticas a nivel comunal. En las ltimas dcadas se han desarrollado un
conjunto de metodologas que reciben el nombre genrico de Estimaciones para reas
Pequeas4 que cuentan con mejores propiedades para la produccin de estadsticas a niveles
geogrficos menores, a partir de la combinacin de datos de encuestas con datos de otras
fuentes, como registros administrativos o censales.
Dado el amplio uso y la creciente demanda por estadsticas a nivel comunal, el Ministerio
acometi la tarea de producir estadsticas ms precisas y exactas a este nivel territorial.
Para ello, el ao 2011, en conjunto con el Programa de las Naciones Unidas para el
Desarrollo (PNUD) en Chile, dio inicio a un proyecto de investigacin para el desarrollo de
una metodologa de estimacin para reas pequeas a partir de los datos de la Encuesta
Casen 2009 y que sera replicable en versiones siguientes. Para tal efecto se cont con la
asesora del experto internacional Partha Lahiri5, quien ha trabajado en diversos pases en el
desarrollo e implementacin de metodologas de estimacin para reas pequeas.
Como se presentar ms adelante, el principal resultado de este trabajo de investigacin,
son las importantes ganancias en trminos de la precisin del estimador de rea pequea
para la produccin de estadsticas a nivel comunal. Esto es de particular relevancia, ya que
permitir a los tomadores de decisin contar con insumos de mejor calidad para distinguir
territorios que presentan distintos niveles de pobreza.
Este documento fue desarrollado con el objetivo de describir y documentar el proceso de
clculo de las tasas de pobrezas comunales estimadas a partir de Casen 2009 y 2011,
utilizando la metodologa de estimacin para reas pequeas desarrollada por el Ministerio6.
1
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Para conocer las estimaciones de las tasas de pobreza comunal para los aos 2009 y 2011,
y sus respectivos intervalos de confianza, revisar el documento Incidencia de la Pobreza a
nivel Comunal, segn Metodologa de Estimacin para reas Pequeas. Chile 2009 y 2011 7.
Para una revisin detallada de la literatura en estimacin par reas pequeas
recomendamos revisar Rao (2013) y Pfeffermann (2002, 2013) y los textos especializados
sugeridos a lo largo de este documento8.
En lo que sigue el documento se organiza de la siguiente manera: la seccin II presenta
brevemente los problemas de la metodologa actual para las estimaciones de nivel comunal;
la
seccin III revisa aspectos metodolgicos y la literatura de estimacin de reas
pequeas; la seccin IV describe paso a paso el proceso de estimacin de la metodologa
implementada en Chile; la seccin V presenta limitaciones de la metodologa actual y reas
de investigacin futura; y la seccin VI presenta las referencias.
II.
En Chile, las estadsticas oficiales de pobreza son estimadas a partir de los datos
recolectados en la Encuesta Casen. Esta encuesta constituye el principal instrumento de
medicin de la realidad socioeconmica de los hogares del pas, y es utilizada para el diseo
y evaluacin de la poltica social existente9.
Los resultados de toda encuesta estn sujetos a errores de muestreo, ya que las
estimaciones se basan en datos recolectados a partir de una muestra y no de un censo de la
poblacin objetivo. Una muestra permite seleccionar un subconjunto de observaciones que
son una rplica aproximada, pero no exacta, de la poblacin total. Estimaciones derivadas a
partir de una muestra para un parmetro de inters como la tasa de pobreza son, por tanto,
una aproximacin del verdadero valor del parmetro, donde la precisin de la aproximacin
viene determinada por el tipo de estimador utilizado, el tamao de la muestra, y las
caractersticas del rea de inters. La precisin se mide, generalmente, a travs de
estimaciones del error de muestreo como el error estndar, el intervalo de confianza o el
coeficiente de variacin de la estimacin10.
El error de muestreo depende de mltiples factores, sin embargo, bajo una estrategia de
estimacin dada, el error de muestreo es mayor cuando el tamao de la muestra es ms
pequeo. Por ejemplo, cuando se desea producir estimaciones para subgrupos de la
poblacin (ej. discapacitados) o para reas geogrficas pequeas (ej. comunas). A mayor
error de muestreo es menor el grado de precisin que se tiene de la estimacin de inters.
profesionales del Ministerio de Desarrollo Social (Isabel Milln, Alvaro Krause, Alvaro Herrera, Alfredo Martin) y
PNUD (Osvaldo Larraaga y Denisse Falk).
7
Ver en referencias documento Incidencia de la Pobreza a nivel Comunal, segn Metodologa de Estimacin para
reas Pequeas. Chile 2009 y 2011 (Ministerio de Desarrollo Social, 2013).
8
Para una mirada sucinta del problema, ver las presentaciones realizada por el Dr. Partha Lahiri en Chile el 18 de
Mayo de 2011 (Lahiri 2011a, Lahiri 2011b) en las referencias.
9
El levantamiento de la Encuesta se realiza de manera peridica y entrega informacin acerca de la incidencia,
magnitud y caractersticas de la pobreza. Esta es una encuesta de hogares residentes en viviendas particulares,
representativa a nivel nacional, regional y urbano/rural. Para mayores antecedentes sobre la Encuesta Casen y el
clculo de la tasa de pobreza con metodologa actual ver Manual del Investigador: Encuesta de Caracterizacin
Socioeconmica Nacional 2011, Observatorio Social, Ministerio de Desarrollo Social.
10
La teora estadstica estndar, conocida como estimacin para poblaciones finitas (Srndal et al., 1992), permite
estimar estos errores para muestras probabilsticas como las de la encuesta Casen.
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Un dominio (rea) se considera grande (o mayor) si la muestra asociada a ese dominio es lo suficientemente
grande como para producir estimaciones directas de precisin adecuada. Un dominio se considera pequeo si la
muestra asociada a ese dominio no es lo suficientemente grande como para producir estimaciones directas de
precisin adecuada. Rao (2003, pg. 1).
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
En Estados Unidos, por ejemplo, programas federales que utilizan mtodos de estimacin de reas pequeas
incluyen: Infant and maternal health for states (NCHS); Personal income for states and counties (BEA); Post-census
population for counties (USCB); Employment and unemployment for states (BLS); Livestock, crop production for
counties (NASS); Disabilities, hospital utilization, physician visits for states (NCHS); Median income for 4-person
families for states (USCB); and Prevalence of alcohol abusers and illicit drug users.
13
Por ejemplo Empirical Best Linear Unbiased Prediction (E-BLUP), Empirical Bayes (EB) y mtodo Hierarchical
Bayes (HB).
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
14
Vase, Citro et al. (1997), Maples y Bell, 2005; Bell et al., 2007 para algunos detalles sobre la metodologa.
El U.S. Census Bureau desarrolla, desde 1997, estimaciones de reas pequeas para la mediana del ingreso, el
total de pobres, el total de nios pobres menores de 5 aos, el total de nios de 5-17 aos en familias pobres y el
total de pobres menores de 18 aos a travs de su programa SAIPE (Small Area Income and Poverty Estimates).
Ver National Research Council (2000, pg. 1).
16
Las estadsticas de las tasas de pobreza infantil, producidas por el programa SAIPE del El U.S. Census Bureau,
sirven como base para la distribucin de fondos de alimentacin bajo la legislacin Improving Americas School
Act. Esta legislacin, conocida como Ttulo I, regula la asignacin de fondos pblicos al programa de educacin
primaria y secundaria ms grande en Estados Unidos, responsable de suplementar fondos locales y estatales para
localidades con nios de bajo desempeo, especialmente en escuelas de bajos ingresos.
17
Para una descripcin completa de la metodologa del Banco Mundial y las aplicaciones del mtodo en diferentes
pases, consulte Elbers et al. (2008), Neri et al. (2005), y otras muchas aplicaciones en diferentes pases, consulte
http://go.worldbank.org/9CYUFEUQ30
15
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
yi | i N ( i , Di ), i 1, , m
(1)
Nivel 2:
i N ( X i , A), i 1, , m
(2)
18
El estimador de James-Stein es el resultado de contraer (shrink) todos los promedios individuales de una
poblacin bajo estudio hacia un gran promedio (el promedio de los promedios). De esta manera, si el promedio de
una unidad en particular es superior al gran promedio, se debe disminuir dicho valor, y si no alcanza el gran
promedio, se deber aumentar. Ver ms detalles de la comparacin de los estimadores James-Stain y Fay-Herriot
en Fay y Herriot (1979).
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Notar que este modelo de dos niveles tambin puede ser escrito como el siguiente modelo
lineal mixto:
Yi i ei X i vi ei
vi N (0, A)
Donde:
, i 1, , m
(3)
ei N (0, Di )
y.
Yi
es un estimador de
Di ,
la cual se asume
es:
(4)
(el verdadero
contenida en el vector
(5)
insesgada estimada de
X i , donde:
ii Di A
El factor de constriccin20
(1 Bi ) (1 ( Di /( A Di ))) ,
Di
es ms grande con
Xi
y la varianza muestral
Di
Notar que esta frmula tambin puede ser expresada como en la ecuacin (14):
EB ( A /( A D )) * Y ( D /( A D )) * Y *
i
i
i
i
i
i
20
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Si bien el mtodo original propuesto por Fay y Herriot utiliza una solucin iterativa para
encontrar el valor del estimador de la varianza A , la literatura reciente ha considerado
distintas formas de obtener dicho estimador (vase Li y Lahiri (2009)).
Uno de estos
estimaciones de mxima verosimilitud son los valores estimados de los parmetros que
maximizan una funcin de verosimilitud determinada. En otras palabras, estiman los valores
de los parmetros bajo los cuales los datos observados habran tenido la ms alta
probabilidad de ocurrencia.
En este contexto, Li y Lahiri proponen la estimacin del parmetro
A mediante la
Ladj ( A) L( A) A
Donde
(6)
L( A) C
1 / 2
exp y ' P y
2
(7)
Ladj ( A) C
Donde
1 / 2
exp y ' P y A
2
(8)
definida
Ladj (A) o,
equivalentemente,
la
correspondiente
funcin
de
(9)
10
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Sea
l adj ( A) ( j ) la j-sima derivada de l adj (A) respecto de A , y luego de derivar (9) respecto
de A , se obtiene:
l adj ( A) (1)
1
y' P 2 y tr
2
1A
1
(10)
A .
( X ' 1 X ) 1 X ' 1Y
(11)
ii Di A
Donde,
Yi* X
(12)
0 y
Finalmente, conociendo el valor de A
pobreza
EB como:
EB Y * (1 B ) * (Y Y * )
i
i
i
i
i
Donde
(13)
).
la estimacin directa ( Di ) es relativamente menor que la varianza asociada al modelo ( A
Notar que la ecuacin (13) tambin puede ser definida como:
EB (1 B )Y B Y *
i
i
i
i i
(14)
EB ( A /( A D )) * Y ( D /( A D )) * Y *
i
i
i
i
i
i
(15)
Para el caso de Chile, la estimacin del parmetro de la tasa de pobreza a nivel comunal,
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
21
12
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
22
13
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
IV.
(Yi ) 25;
(X i ) ;
A , Di , Bi ;
(Yi* ) ;
( i ) ;
original;
SAE
( IC ( Pi SAE )) .
A continuacin se describe en detalle cada paso de este proceso. Los grficos y tablas que se
presentan muestran los resultados del proceso de estimacin con datos Casen 2009. Los
mismos procedimientos se aplicaron para la produccin de las estimaciones a partir de los
datos de la Encuesta Casen 2011.
25
Este clculo se realiza utilizando los factores suavizados calculados en el primer paso.
14
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Los factores regionales se usan para producir estimaciones a nivel nacional, rea y
regiones, ya que expanden al total de la poblacin que reside en hogares particulares
del pas, tanto de las comunas en la muestra como las fuera de la muestra. Es decir,
toda la poblacin del pas est cubierta por los factores regionales.
Tanto los factores de expansin comunales (expc) como los regionales (expr) estn
disponibles en las bases de datos pblicas de la Encuesta Casen. Para la produccin de las
estimaciones directas a nivel comunal se utilizaron los factores de expansin comunal. Antes
de proceder con la estimacin del modelo, se realiza un anlisis estadstico con el fin de
suavizar los factores de expansin. Esta medida se implementa para evitar que valores
extremos (outliers) en el factor de expansin influencien en forma negativa la contribucin
de la estimacin directa a la tasa de pobreza de reas pequeas. Para realizar esta
suavizacin se utiliz uno de los mtodos en Potter (1993). En sntesis, el mtodo utilizado
busca encontrar una distribucin de factores de expansin que minimice el error cuadrtico
medio (MSE) de la variable de inters.
(16)
K g Cg
w
ng
2
jg
(17)
26
Para detalles sobre el proceso de desarrollo de los factores de expansin de las encuestas Casen 2009 y 2011 ver
documentos metodolgicos en las referencias.
27
Las comunas no incluidas en la muestra Casen 2011 corresponden a las reas de difcil acceso que no estn
incluidas en el marco muestral del Instituto Nacional de Estadsticas (INE). Ver detalles en documento de diseo
muestral Casen 2011 (Ministerio de Desarrollo Social 2011, pgs. 18-20).
15
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Donde
en su grupo g,
w jg si w jg K g
wT jg
K g si w jg K g
Donde
wT jg
(18)
j en cada grupo g.
La suma de los factores de expansin comunales originales
( w jg ) corresponde a una
( wTjg )
continuar con el procedimiento, se deben corregir los factores truncados en (18) de manera
de poder reproducir los totales poblaciones de inters. El factor de expansin suavizado y
corregido
w Sjg
w
w
jg
T
jg
(19)
(20)
jg
T
jg
grupo g.
La Tabla 1 presenta informacin sobre los lmites
( K g ) utilizados en el truncamiento de
16
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Tabla 1.
Estadstica descriptiva del factor de expansin comunal original, K ptimo y
total de factores truncados, segn grupo g. Casen 2009.
Grupo
g
Media
Mnimo
Mximo
ptimo
( w jg )
( w jg )
( w jg )
Kg
Total de
factores
truncados
(freq.)
87,4902
501
137,6
748
10,1405
34
63,0
94,3949
692
672,7
32
4,5907
27
32,5
59,8353
1.363
731,7
12
14,3449
47
83,4
95,7634
558
524,6
82
27,3082
134
127,6
58
74,0826
1.020
112,6
4.117
10
23,0577
100
75,7
105
11
53,7106
637
262,0
229
12
22,6640
110
87,7
171
13
69,0955
405
141,5
1.471
14
26,0215
160
49,8
1.760
15
66,7037
1.095
346,3
105
16
20,2520
203
30,6
2.929
17
60,0223
548
318,7
225
18
28,2342
183
37,2
2.152
19
70,5936
693
118,5
1.547
20
22,8171
461
67,9
673
21
37,9711
183
52,8
497
22
9,9334
34
11,8
328
23
85,7458
544
777,8
24
9,8642
41
14,1
67
25
147,5910
4.103
1.445,2
81
26
38,0404
1.147
476,6
18
27
53,8487
520
287,1
86
28
31,1182
237
135,4
54
29
106,1280
475
133,2
268
30
14,3313
57
103,1
Total
17.815
17
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
( w jg ) y los
originales ( w jg ) y truncados/ajustados ( w jg )
Yi
El Grfico 5 muestra la relacin que existe entre la tasa de pobreza estimada mediante el
uso de los factores de expansin comunal originales y la tasa de pobreza estimada mediante
el uso de factores de expansin comunal truncados y ajustados. En general, se observa que
para la mayora de las comunas el cambio en el valor en las tasas de pobreza es marginal.
18
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Grfico 5
Comparacin de Tasas de Pobreza estimada utilizando
factores de expansin comunal originales y truncados/ajustados. Casen 2009.
28
Dado que el ltimo Censo de poblacin y Vivienda disponible para Chile corresponde al del ao 2002, es deseable
el uso de variables que no cambien de manera significativa en el corto plazo.
29
El proceso de identificacin y seleccin de variables a evaluar fue desarrollado en conjunto por los equipos
tcnicos del ministerio y PNUD. Tambin se realiz consulta a acadmicos del rea.
30
Describen los resultados sociales que las polticas intentan influenciar, es decir, describen las condiciones
generales de la poblacin a nivel de ingresos, salud, educacin, empleo, seguridad ciudadana, entorno, etc.
19
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Adicionalmente a las variables y fuentes de datos antes sealadas, la base de datos tambin
incorpor una variable extrada de la misma serie de encuestas Casen - el promedio de las
estimaciones directas de la tasa de pobreza para los ltimos tres aos31. El porcentaje de
personas que vivieron bajo condiciones de pobreza en una comuna en aos anteriores, es
probablemente un buen predictor del porcentaje de personas que viven bajo pobreza en
periodos siguientes. La estimaciones Casen de un ao en particular, sin embargo, son
imprecisas para muchas comunas. Para compensar en parte este problema, se opt por
utilizar el promedio de los tres ltimos aos para cada comuna, con la finalidad de reducir en
parte el error de medicin asociado al uso de las estimaciones puntuales de cada ao. En el
Anexo 1 de este documento se encuentra la lista de variables consideradas para la eleccin
del modelo (fuente, periodicidad y ao de disponibilidad de los datos).
4. Transformacin de las tasas de pobreza para estabilizar la varianza muestral
La estimacin del modelo de reas definido en (1)-(4), para el caso de una variable
dependiente como la tasa de pobreza, requiere de la aplicacin de una transformacin que
permita estabilizar la varianza de las estimaciones provenientes de la muestra (Carter y
Rolph, 1974).
La tasa de pobreza comunal ( Pi ) se puede estimar, a partir de los datos muestrales, como
la proporcin de personas pobres en una comuna sobre el total de la poblacin comunal. La
varianza de este indicador viene dada por la expresin:
var( Pi ) ( Pi )(1 Pi ) /( ni 1)
(21)
Di
en la
propuesto por James-Stein32. Para corregir este problema, diversos autores han propuesto la
aplicacin de procedimientos que permitan estabilizar la varianza del estimador bajo estudio.
Para el caso de una proporcin, se propone el uso de la transformacin arcoseno sobre la
raz cuadrada de
Pi tenemos que,
Yi sin 1 Pi
Var (Yi )
1
4n i
(22)
31
Para el modelo 2009 se utiliz el promedio de las estimaciones directas asociadas a los aos 2000, 2003 y 2006.
Para el modelo 2011 se utiliz el promedio de aos 2003, 2006 y 2009. Notar que para el ejercicio con los datos
2011 se utiliz la pobreza directa del 2009, no la pobreza SAE 2009.
32
Yi ind N ( i , D) ,
i y
Yi se
asumen
varianza
D,
D se asume como un escalar constante conocido. Ver en Fay y Herriot (1979, pg 270).
20
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Pi no provienen de un
diseo muestral aleatorio simple, sino de un diseo muestral complejo que involucra
diversos grados de estratificacin, conglomeracin y probabilidades de seleccin desigual 33.
La expresin para la varianza en (22), por lo tanto, no aplica directamente al caso de las
estimaciones provenientes de la muestra Casen. Una forma relativamente sencilla, y
ampliamente utilizada para incorporar el efecto del diseo muestral complejo a una
estimacin de varianza, es el reemplazo del tamao de la muestra ( ni ) por el tamao
efectivo de muestra (Kish, 1965)3435.
La expresin que sigue representa una aproximacin de la varianza de la transformacin
propuesta por Carter y Rolph (1974) bajo muestreo complejo, la cual se obtiene
reemplazando en la ecuacin (22) el tamao efectivo de muestra ( m i ) por el tamao de la
muestra ( ni ) en la comuna i.
Di Var (Yi )
deff i
1
4m i
4n i
(23)
Di
bajo el diseo
Para detalles sobre el diseo muestral de las encuestas Casen 2009 y 2011 ver documentos metodolgicos
respectivos en las referencias.
34
El tamao efectivo de muestra ( m ) se define como la razn entre el tamao muestral ( n ) y el efecto diseo
asociado a la variable de inters ( deff ). Esta expresin, propuesta en Kish (1965), trata de ilustrar el efecto del
diseo muestral en la precisin de las estimaciones relacionando incremento en el efecto diseo a reduccin en el
tamao de muestra.
35
El efecto diseo es un parmetro poblacional que depende del diseo muestral (s) y del estimador de inters (z)
y se define como la razn entre la varianza de un estimador bajo un determinado diseo muestral
varianza de ese mismo estimador bajo muestreo aleatorio simple
var( z) mas
var( z) s
y la
(Kish, 1965).
36
El uso de esta aproximacin sigue un razonamiento estadstico. En reas grandes (e.g. regin) los errores de
muestreo de los estimadores son suficientemente pequeos para ser escogidos como los mejores estimadores, pero
en reas pequeas (e.g. comunas), es preferible sustituir estimadores sesgados con error de muestreo despreciable
21
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
La frmula para el clculo del efecto diseo asociado a cada comuna i corresponde a:
deff i deff ri
Vr*
Pr (1 Pr )
n rv
(24)
Tarapac
3,280
Antofagasta
5,750
Atacama
6,477
Coquimbo
4,665
Valparaso
3,390
OHiggins
4,307
Maule
4,870
Biobo
5,506
Araucana
5,618
10
Los Lagos
6,095
11
Aysn
2,843
12
Magallanes
2,323
13
Metropolitana
3,290
14
Los Ros
8,681
15
Arica y Parinacota
2,864
(estimacin regional) por estimadores con errores de muestreo grande (estimacin comunal). Ver breve comentario
en relacin a este tipo de prctica en Fay y Harriot (1979, pg. 269).
37
Notar que tanto la pobreza regional, as como su varianza, han sido estimadas utilizando los factores de
expansin comunal previamente suavizados (ver seccin 4.2).
22
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
y
razn, los parmetros A
B i
Di
Di A
1 Bi
. Mientras que
A , Di , Bi .
5.1
Di ,
Estimacin de A
Estimacin de
Di
23
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Tabla 4.
Estadsticas descriptivas de la varianza de la tasa de pobreza directa (Di),
segn cuartiles de la distribucin de Di.
Cuartiles de la
Media
mediana
Min
Max
distribucin de Di
1 = menor Di
0,0009047
0,0008931
0,0004453
0,0012006
0,0014632
0,0015082
0,0012023
0,0016854
0,0019475
0,0019501
0,001686
0,0021987
4 = mayor Di
0,0030616
0,0025722
0,0022082
0,0113181
Total
0,0018417
0,0016857
0,0004453
0,0113181
1000
0
500
tamao muestral
1500
Grfico 6.
Relacin entre tamao muestral de la comuna y la varianza
del estimador directo de pobreza
.005
varianza conocida D
.01
5.3
Estimacin de
Bi
Bi ,
de las varianzas del estimador directo y el sinttico. Este factor se utiliza para estimar la
ponderacin de los estimadores directo y sinttico de cada comuna, en la determinacin del
estimador Bayesiano de la tasa de pobreza. Cabe recordar que en cada comuna este
ponderador se determina a partir del valor de la varianza asociada a la estimacin directa de
la tasa de pobreza ( Di ) y la varianza asociada al modelo ( A , que es igual para todas las
comunas), y dependiendo de esta relacin, la estimacin directa de la tasa de pobreza tiene
ms o menos peso en la tasa de pobreza SAE.
A partir de los resultados presentados, es posible sealar que, el ao 2009, cerca de un
cuarto de las comunas tiene un ponderador inferior a 50% para la estimacin directa de
24
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
tienen muy poca precisin, se le cree en mayor medida a la estimacin proveniente del
modelo
(Yi* ) .
(1 Bi ) .
Tabla 5.
0,2765
0,1598
0,3390
0,3836
0,3393
0,4186
0,4535
0,4186
0,4843
4 = mayor Di
0,5474
0,4854
0,8286
Total
0,4150
0,1598
0,8286
6.
Previo a la seleccin de las variables a incluir en el modelo de reas, las variables que fueron
evaluadas fueron transformadas respecto de su escala original. Tasas y proporciones fueron
transformadas a una escala arcoseno, mientras que variables continuas y de cuenta fueron
transformadas a logaritmo (ver seccin 4.3).
El proceso de seleccin del modelo tuvo como objetivo buscar un buen ajuste (medido por el
R2 ajustado) y parsimonia (buscar un mnimo set de predictores)38. Con este fin, se utiliz el
procedimiento stepwise en Stata 11, de manera de reducir el nmero de variables
independientes en atencin a su capacidad explicativa del modelo. El modelo de seleccin de
los predictores se estim con Mnimos Cuadrados Ordinarios. El modelo para la estimacin
de los parmetros
38
A modo de referencia, el modelo de rea para las estimaciones a nivel de condados que utiliz el programa
SAIPE (Small Area Income and Poverty Estimates) para la estimacin del nmero de pobres en el 2011 incluy slo
5 variables: nmero de devoluciones de impuestos para aqullos cuyo ingreso bruto es menor al umbral de
pobreza; beneficiarios de food stamps; poblacin menor de 18 aos; nmero de exenciones tributarias por
tenencia de nios y datos del Censo 2000 de nmero de nios entre 5 y 17 aos en situacin de pobreza. Ver
detalles en National Research Council (2000).
25
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
39
La tasa de pobreza en Chile se calcula relacionando los ingresos de un hogar con una
lnea de pobreza, en este sentido, los ingresos estn directamente relacionados a la
condicin de pobreza. Por esta razn, la inclusin de la remuneracin de los
trabajadores dependientes es una variable relevante para incluir en el modelo de
reas. La variable que promedia las tasas de pobreza de los ltimos tres aos para
cada comuna busca capturar parte de este fenmeno.
Ver en Anexo 1 mayor informacin de las variables seleccionadas, fuente y fecha de la informacin.
26
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
La probabilidad de ser pobre puede estar influenciada por el hecho de haber sido
pobre en el pasado, esto generalmente se ve reflejado en el trmino conocido como
pobreza dura. Este tipo de pobreza ha generado el desarrollo de programas tales
como Chile Solidario, Chile Barrios y otros. Aunque la evidencia para Chile
(Contreras et al., 2004) muestra alta movilidad de las personas en torno a la lnea de
pobreza (caen y salen de situacin de pobreza), tambin muestra un porcentaje de
personas que permanece en situacin de pobreza.
La ruralidad puede ser otro factor determinante en las tasas de pobreza, para el caso
de Chile, el ingreso en zonas rurales es inferior al ingreso en zonas urbanas 40 lo que
tiene un impacto directo en la pobreza. Para Latinoamrica, aunque el nmero de
pobres se concentra en zonas urbanas, la tasa de pobreza sigue siendo un fenmeno
rural (Echeverra, 2000)
7. Clculo de las estimaciones sintticas de pobreza
Y
*
Una vez obtenido el conjunto de Betas asociados a las variables administrativas se procede a
estimar una tasa de pobreza sinttica
EB )
(
i
Yi
Y .
*
EB ,
Sin embargo, como se hace mencin en Fay-Herriot (1979), los estimadores Bayesianos
pueden presentar un desempeo adecuado en general, pero un desempeo pobre para
algunos de los componentes en particular. Aplicado al contexto chileno, esto quiere decir
que el modelamiento que beneficia a la mayora de las comunas puede ser inapropiado para
algunas comunas. Esta situacin se puede dar, por ejemplo, por mala especificacin del
modelo, datos administrativos con error de medicin distinto entre comunas, o por la
presencia de valores extremos (outliers).
40
Segn datos de Encuesta casen 2011, el ingreso autnomo per cpita es 60% mayor en zonas urbanas. (150.980
en zona rural versus 242.184 en zona urbana)
27
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
EB ) , se sugiere utilizar
(
i
iEB
iEB
Yi c Di
Yi c Di
iEB Yi c Di
si Yi c Di
iEB Yi c Di
si
(25)
iEB Yi c Di
si
Donde c es una constante, definido como c=1 para las aplicaciones del programa SAIPE
(EE.UU.) y tambin para la aplicacin en Chile. La idea general de este truncamiento es
limitar la desviacin del estimador bayesiano
i
i
perdida de eficiencia en reas o comunas donde el modelo falla, sin perder los beneficios
que provoca en aquellas reas o comuna donde ste funciona bien.
La aplicacin de este criterio para el caso chileno afecta, en la estimacin 2009, a 45
comunas: en 21 comunas la estimacin bayesiana supera en un error estndar o ms la
estimacin directa Yi , y en 24 comunas es inferior en un error estndar o ms de tal
estimacin directa. El Grfico 7 presenta a las comunas ordenadas segn el valor que tiene
su estimador bayesiano de tasa de pobreza posterior a la aplicacin de este criterio. Para
cada comuna, el Grfico tambin ilustra el valor que tienen los lmites presentados en la
ecuacin (25). Se marca a travs de crculos aquellas comunas donde la estimacin
bayesiana es mayor que la estimacin directa en un error estndar ms, y a travs de
cruces donde es menor en un error estndar o ms (ambos smbolos marcan el valor de
truncamiento).
Grfico 7
Truncamiento del Estimador Bayesiano de Pobreza
28
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
EB ) 2
Pi EB sin(
i
Donde
(26)
original.
11.Clculo de la tasa de pobreza SAE
( Pi SAE )
Una propiedad deseable para las estimaciones de un fenmeno de inters es que ellas sean
consistentes a distintos niveles de agregacin. Esto quiere decir, para el caso de la tasa de
pobreza por ejemplo, que las estimaciones de porcentaje de personas pobres en una regin
X coincidan independientemente de si la estimacin se realiza en forma directa a nivel
regional o bien a partir de los estimadores bayesianos derivados para las comunas en la
regin. Dicho de otra forma, dado que las estimaciones directas a nivel regional son
confiables, se espera que las estimaciones bayesianas del nivel comunal sean consistentes
con la estimacin regional correspondiente.
Con esta finalidad, se realiza un ajuste final a las estimaciones bayesianas de pobreza
comunal con el fin de imponer una consistencia lgica a los resultados. El ajuste, propuesto
en Fay y Herriot (1979), consiste en hacer coincidir los niveles de pobreza regional
obtenidos mediante la estimacin Bayesiana
la encuesta
Yr .
P
EB
Pi EB ). De esta forma, el
29
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Rr
Yr N r
(27)
com
P
i 1
EB
Ni
Donde
com
P
i 1
EB
i
EB
Realizando el ajuste especificado, se tiene que la tasa de pobreza final (en adelante
denominada tasa de pobreza SAE) para cada comuna es:
Pi SAE Pi EB Rr
(28)
La Tabla 7 presenta los factores de ajustes para cada regin del pas estimados, para el ao
2009, mediante la ecuacin (27). En promedio estos factores estn en torno a uno, lo que
implica que las estimaciones comunales de pobreza SAE son consistentes con la
correspondiente tasa de pobreza regional estimada en forma directa, considerando a este
ltimo un dato confiable para usar como marco de referencia. Esto permite sealar que el
modelo implementado en la estimacin de las tasas de pobreza SAE funciona de buena
manera en la mayora de las regiones43.
41
30
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Tabla 7.
Factores de ajuste por regin. Casen 2009.
Regin
Rr
1
Tarapac
1,12172
Antofagasta
0,97455
Atacama
1,06685
Coquimbo
1,04309
Valparaso
1,00387
OHiggins
1,00430
Maule
1,05292
Biobo
0,99010
Araucana
1,01628
10
Los Lagos
1,04088
11
Aysn
1,06255
12
Magallanes
0,97368
13
Metropolitana
0,97765
14
Los Ros
1,08572
15
Arica y Parinacota
0,99486
Total
1,014982
EB
i
Bayesiano de
. Es importante recalcar la
necesidad de construir estos intervalos de confianza debido a que, si bien las estimaciones
SAE son ms precisas que las estimaciones directas de tasas de pobreza comunal, stas
siguen teniendo asociado un nivel de imprecisin.
12.1. Problemas para estimar la precisin del estimador Bayesiano
El estimador Bayesiano de la tasa de pobreza
iEB
estimadores que tienen asociado cierto nivel de imprecisin, por lo tanto, un desafo
adicional consiste en producir una medida que permita reflejar el grado de imprecisin que
tambin existe en la estimacin Bayesiana44.
Existen varios estimadores que permiten reflejar el grado de imprecisin de un estimador de
inters (z), entre ellos el error estndar (SE(z)), el coeficiente de variacin (CV(z)) y los
intervalos de confianza (IC(z)). Para el caso de Chile se opt por desarrollar estimaciones
44
El mtodo original propuesto por Fay y Herriot no consider la construccin de intervalos de confianza para el
estimador
EB .
31
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
EBLUP z / 2 MSPE ,
z / 2 es el valor crtico
iEB
A continuacin se resumen en seis pasos para la aplicacin del clculo de los intervalos de
confianza del estimador Bayesiano de la tasa de pobreza para las comunas de Chile. Para
detalles de la implementacin del mtodo y la revisin de las propiedades del mtodo en
contraste con los otros mtodos disponibles ver Chatterjee, Lahiri y Li (2006).
Paso 1: Generar, para cada comuna i, cinco mil muestras bootstrap (k=1, ,5000) de los
estimadores
~
i N ( x'i , A), i 1,, m
(31)
~
~
~
yi | i N (i , Di ), i 1,, m
(32)
~
~
Bi y para cada muestra de ~y i generada en el Paso
1. Con estos parmetros calcular para cada muestra la estimacin Bayesiana de pobreza
~
~
~
~
~
~
iEB (1 Bi ) ~
yi Bi ( x'i ) , donde Bi Di /( A Di ) y Di corresponde al calculado en la
45
Las probabilidades de cobertura de este tipo de intervalos pueden converger al valor nominal de (1-), pero los
intervalos no son eficientes, en el sentido de que tienen problemas de subcobertura o sobrecobertura, dependiendo
de la eleccin particular del estimador MSPE. Ms precisamente, el error de cobertura de este tipo de intervalos es
de orden O(n-1) o mayor, lo cual no es suficientemente preciso para la mayora de las aplicaciones de los estudios
de reas pequeas, muchos de los cuales involucran tamaos de muestra pequeos (Chatterjee, Lahiri y Li 2006,
pg. 1222).
46
Resultados de simulaciones en Chatterjee, Lahiri y Li (2006) demuestran la superioridad del mtodo de bootstrap
paramtrico por sobre otras tcnicas existentes utilizadas en la construccin de intervalos de confianza en el
contexto de modelos lineales mixtos.
32
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
seccin IV.5.2. Al trmino de este paso, se habrn generado cinco mil valores de
~
iEB para
cada comuna i.
Paso 3: Calcular
ti
~
i proviene de
~
~
Bi y iEB fueron calculadas en el Paso 2
~
~
~
t i (i iEB ) / Di (1 Bi )
Paso 4: Ordenar de menor a mayor los valores de
una distribucin emprica de
los valores crticos de
(33)
corresponden
t para
tres comunas en
es
relativamente simtrica en torno a cero, por lo tanto los valores de los umbrales de corte
asociados a los percentil 2,5 ( t i1 ) y 97,5 ( t i 2 ) sern de magnitudes relativamente parecidas.
Comunas como Providencia y Peumo, sin embargo, presentan distribuciones asimtricas en
torno a cero, lo cual dar origen a valores de corte de magnitudes distintas para
t i1 y t i 2 .
Paso 5: Calcular los intervalos de confianza, utilizando la expresin (34), a partir de valores
EB t D (1 B )
I (t )
i
i
i
Donde
(34)
i
i
i
i
i
33
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
2
SAE
2
EB t D (1 B )
IC ( Pi ) 5% sinI (ti1 ) sin
i
i1
i
i
(35)
2
SAE
2
EB t D (1 B )
IC ( Pi ) 95% sinI (ti 2 ) sin
i
i2
i
i
(36)
Como cabe esperar de este procedimiento bootstrap paramtrico, las estimaciones de los
intervalos de confianza resultantes tienen cierto grado de asimetra. En la Tabla 8 se ilustra
este punto para las tres comunas en el Grfico 8. La tabla presenta las estimaciones de la
tasa de pobreza SAE (columna 2), los lmites inferior y superior del intervalo de confianza
asociado a la tasa de pobreza SAE (columnas 1 y 3), y el largo del intervalo de confianza47
superior e inferior de la tasa de pobreza SAE (columnas 4 y 5).
La comuna de Puchuncav, que en el grfico 8 presenta una distribucin de
relativamente
t lo
que
luego se traduce en mayor precisin en la estimacin del intervalo superior del intervalo de
confianza respectivo. El caso contrario se observa para la comuna de Peumo.
Es importante recordar esta particularidad del procedimiento de estimacin de los intervalos
de confianza del estimador de reas pequeas, ya que es mucho ms comn encontrar
intervalos de confianza simtricos en la inferencia estadstica para reas grandes.
47
El largo del intervalo de confianza corresponde simplemente a la diferencia entre el lmite del intervalo y el
estimador de la tasa de pobreza. En la tabla 8, para el largo inferior corresponde a Columna (1) Columna (2), y
para el largo superior corresponde a Columna (3) Columna (2).
34
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Grafico 8
Distribucin de estadsticos t, bootstrap (k=5.000)
.2
0
.1
Density
.3
.4
Panel (a)
-4
-2
0
Puchuncavi
Panel (c)
.1
.2
Density
.2
.1
0
Density
.3
.3
.4
.4
Panel (b)
-6
-4
-2
Providencia
-4
-2
0
Peumo
Tabla 8.
Estimador Bayesiano, Intervalos de confianza y Largo del Intervalo de confianza
de la Tasa de Pobreza SAE. Casen 2009.
Lmite
inferior
IC
(1)
Tasa
pobreza
SAE
(2)
Lmite
superior
IC
(3)
Largo del
IC
Inferior
(4)
Largo del
IC
superior
(5)
Puchuncav
10,7%
14,1%
18,1%
-3,40pp
4,00pp
Providencia
-0,4%
0,2%
0,3%
-0,60pp
0,10pp
Peumo
13,1%
14,7%
22,0%
-1,60pp
7,30pp
Nombre
Comuna
35
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
V.
El mtodo aqu propuesto utiliza el estado del arte en metodologa de estimacin emprica
Bayesiana, la cual ha demostrado mejorar las estimaciones directas en numerosos estudios
(e.g. Efron y Morris, 1975; Fay y Herriot, 1979; Bell et al., 2007). Al igual que en dichos
estudios, hemos notado mejoras similares en el contexto Chileno en trminos de reduccin
del largo de los intervalos de confianza para la mayora de las comunas en las muestras
Casen 2009 y 2011. Estos resultados resultan prometedores, sin embargo hay aspectos de
la metodologa desarrollada que podran beneficiarse de un programa continuo de
investigacin y evaluacin: (1) mejorar la estrategia para estimar la varianza asociada al
estimador directo comunal, (2) mejorar la especificacin del modelo de la tasa de pobreza
comunal, (3) identificar mejores variables auxiliares para el modelo comunal, (4) evaluar el
desempeo de los resultados del modelo lineal mixto en comparacin con otros modelos de
estimacin para reas pequeas (e.g. mtodo ELL, mtodos no pareados, y otros en Rao
(2003)), y (5) desarrollar estimaciones de reas pequeas para otras variables de inters,
por mencionar algunos.
Los estimadores empricos Bayesianos, a diferencia de los estimadores directos, se basan en
modelos mixtos y por lo tanto existe una necesidad de monitorear continuamente la
metodologa y desarrollar investigacin que permita evaluar y actualizar los mtodos aqu
desarrollados. Este tipo de evaluacin debiera ser productivo para el desarrollo de un slido
programa de produccin de mapas de pobreza local en Chile. En esta lnea, es importante
recordar que mejoras en la produccin de estadsticas comunales no solo depende del uso
de metodologas de estimacin adecuadas -- los resultados del proceso de anlisis son
condicionales al diseo de la muestra. Esto quiere decir, por lo tanto, que se requiere
avanzar en el desarrollo de una estrategia integral para la estimacin en reas pequeas en
la cual se deben dedicar esfuerzos tanto a la etapa de diseo muestral como a la de
estimacin. Estrategias de este tipo se describen en Singh et al. (1994), Marker (2001) y
Choudhury et al. (2012).
Para finalizar, cabe hacer una reflexin sobre las limitaciones y los usos de las estimaciones
aqu desarrolladas. Las estimaciones derivadas a partir de metodologa de estimacin para
reas pequeas, al igual que las estimaciones directas, estn sujetas a errores muestrales y
no muestrales. El objetivo de esta investigacin ha sido mejorar la precisin de las
estimaciones comunales. Los nuevos estimadores desarrollados, aunque ms robustos que
los anteriores, tambin estn sujetos a cierto nivel de imprecisin. Es importante considerar
este hecho al momento de hacer uso de estos resultados, especialmente si los mecanismos
de asignacin de recursos han sido diseados para utilizar las estimaciones puntuales, y no
sus errores muestrales asociados. En Chile, al igual que en otros pases, las estimaciones de
pobreza a nivel local son utilizadas en procedimientos de asignacin de recursos entre
localidades. Existe, por lo tanto, la necesidad de desarrollar reglas robustas para la
distribucin de recursos a nivel local, de manera que las diferencias dentro de los mrgenes
de error sean consideradas como tales, sea al comparar estimaciones entre comunas en un
mismo perodo, o al contrastar tasas de pobreza estimadas para una misma comuna en
distintos aos. Para avanzar en posibles estrategias de asignacin de presupuesto entre
localidades, que usan como insumos estimaciones en base a muestras pequeas, se sugiere
revisar la discusin al respecto disponible en: Statistical issues in allocating funds by
formulas, Panel on Formula Allocations, Thomas et al. (Editors), National Research Council
(2003).
36
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
VI.
Referencias
and
its
Elbers, C., J. Lanjouw, and P. Lanjouw, Micro-Level Estimation of Poverty and Inequality,
Econometrica 71:1 (2003), 355364.
Elbers, Chris, Peter Lanjouw, and Philippe George Leite, Brazil within Brazil: Testing the
Poverty Map Methodology in Minas Gerais, World Bank policy research working paper no.
4513 (2008).
37
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Esteban, M.D., Morales, D., Prez, A. and Santamara, L. (2011), Small area estimation of
poverty proportions under area-level time models, Computational Statistics and Data
Analysis. DOI: 10.1016-j.csda.2011.10.015.
Eltinge, Cho and Hinrichs, (2002), Use of generalized Variance Functions in Multivariate
Analysis. Proceedings of the American Statistical Association, N74.
Fay, R.E., and Herriot, R.A. (1979), Estimates of income for small places: An application of
James_Stein procedure to census data, Journal of the American Statistical Association 74,
269_277.
Gabler, S., Haeder, S., and Lahiri, P. (1999), A model-based justi_cation of Kish's formula
for design e_ects for weighting and clustering, Survey Methodology, 25, 105-106.
Gershunskaya, J. and Lahiri, P. (2005), Variance Estimation for Domains in the US Current
Employment Statistics program. Proceedings of the American Statistical Association, Survey
Research Methods Section.
Haslett S. and Jones, G. (2006) Small area estimation of poverty, caloric intake and
malnutrition in Nepal. Nepal Central Bureau of Statistics / World Food Programme, United
Nations / World Bank, Kathmandu, September 2006, 184pp, ISBN 999337018-5.
Huff, Eltinge and Gershunskaya, (2002), Exploratory Analysis of generalized Variance
Function models for the US Current Employment Survey. Proceedings of the American
Statistical Association, Survey Research Methods Section.
Jiang, J. and Lahiri, P. (2006). Mixed model prediction and small area estimation. Test 15 1
96. MR2252522.
Kish, (1965), Survey Sampling. John Wiley & Sons, Inc., New York, London.
Liu, Lahiry and Kalton, (2007), Hierarchical Bayes modeling of Survey Weighted Small Area
Proportions. Proceedings of the American Statistical Association, Survey Research Methods
Section.
Li, H. and Lahiri, P. (2010). An adjusted maximum likelihood method for solving small area
estimation problems. J. Multivariate Anal. 101 882892. MR2584906
Lohr, S (1999), Sampling: Design and Analysis (Advanced Series). Pacific Grove,
CA:Brooks/Cole Publishing
Maples, J., and Bell, W.R. (2005). Evaluation of school district poverty estimates: Predictive
models using IRS income tax data. Proceedings of the Survey Research Methods Section,
American Statistical Association.
Marker, D.A. (2001), Producing small area estimates from national surveys:
minimizing the use of indirect estimators, Survey Methodology, 27, 183-188.
methods for
Molina, I. and Rao, J.N.K. (2010), Small area estimation of poverty indicators, Canadian
Journal of Statistics, 38, 369-385.
38
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
developments
and
directions.
Pfeffermann, D. (2013). New Important Developments in Small Area Estimation. Statist. Sci.
Volume 28, Number 1 (2013), 40-68.
Potter F.J. (1993), The effect of weight trimming on nonlinear survey estimates; 1993, San
Francisco, CA: American Statistical Association.
Rao, J. N. K. Small Area Estimation, Wiley, New York, 2003.
Rivest and Vandal, (2003), Mean Squared Error Estimation for Small Areas When the Small
Area variances are estimated. Proceedings of the International Conference on recent
Advances in Survey Sampling, ed. J.N.K. Rao.
Singh, M.P., Gambino, J., and Mantel, H.J. (1994), Issues and strategies for small area data,
Survey Methodology, 20, 3-22.
Srndal, Swensson and Wretman, (1992); Model Assisted Survey Sampling.
Springer-Verlag.
New York:
Tarozzi, A. and Deaton, A. (2009). Using census and survey data to estimate poverty and
inequality for small areas. Review of Economics and Statistics, 91, 773792.
Wang, Fuller, and Wayme (2003). The Mean Squared Error of Small Area Predictors
Constructed with Estimated Error variances. Journal of the American Statistical Association,
N98.
Ybarra, Y.M.L and Lohr, S. (2008), Small area estimation when auxiliary information is
measured with error, Biometrika, 95, 919-931.
You and Chapman, (2006), Small Area Estimation Using Area Level Models and estimated
Sampling Variances. Survey Methodology, N32.
39
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
40
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
VII. ANEXOS
Anexo 1
Variables contenidas en la base de datos comunal
Variable
Remuneraciones
promedio de los
trabajadores
dependientes
Razn de
analfabetos
respecto a la
poblacin de 10 y
ms aos en la
comuna
Anual
Ultimo
ao
disponible
2010
Decenio
2002
Censo de
Poblacin y
Vivienda,
Instituto
Nacional de
Estadsticas
(INE)
Anual y ao
por medio
2008
Prueba
SIMCE,
Ministerio de
Educacin
Considera profesionales
universitarios y tcnicos.
Decenio
2002
Censo de
Poblacin y
Vivienda, INE
Anual
2010
Anual y
quinquenal
20002005*
Observatorio
Habitacional,
Ministerio de
Vivienda y
Urbanismo
(Minvu)
Depto.
Epidemiologa,
Ministerio de
Salud (Minsal)
Anual
2008
DEIS, (Minsal)
Anual
2008
DEIS, (Minsal)
Descripcin
La renta imponible o
remuneracin imponible
corresponde a la renta
informada en la planilla de
pago de cotizaciones. En el
caso que existan dos
cotizaciones en un mes para
una misma relacin laboral, se
suman las rentas informadas.
El clculo del indicador "razn
de analfabetismo" consisti en
dividir el nmero de poblacin
analfabeta de 10 aos y ms
por la poblacin total de 10
aos y ms.
Promedio SIMCE
4 y 8 bsico
lenguaje y
matemticas
Porcentaje de
capital humano
avanzado respecto
a la poblacin
comunal
Porcentaje de
vivienda social
Esperanza de vida
al nacer
Tasa de mortalidad
infantil
ndice de
SWARROP
Periodicidad
Fuente
Subsecretara
del trabajo,
Ministerio del
Trabajo
41
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Aos de vida
potencialmente
perdidos
Porcentaje de
sobre peso,
obesidad y retraso
en talla en
nios/as menores
de 6 aos
Porcentaje de
desnutricin, sobre
peso, obesidad en
adultos mayores
Fecundidad
declarada en
menores de 19
aos
Presupuesto
comunal per cpita
Anual
Ultimo
ao
disponible
2008
Anual
2010
DEIS, (Minsal)
Anual
2010
DEIS, (Minsal)
Decenio
2002
Depto.
Demografa,
INE
Anual
2009
ndice de
dependencia
familiar
Anual
2010
SINIM,
Subsecretara
de Desarrollo
Regional
Depto.
Demografa,
INE
Anual
2010
Variable
ndice de vejez
Tasa de migracin
comunal
Tasa de
crecimiento natural
de la poblacin
comunal
Porcentaje
poblacin con
puntaje FPS menor
a 8.500 respecto a
poblacin comunal
Descripcin
Qu se entiende por
fecundidad: embarazos o nios
nacidos de madres
adolescentes?
Cobertura
aplicacin FPS
respecto poblacin
comunal
Porcentaje de
Periodicidad
2002
Decenio
Fuente
DEIS, (Minsal)
Depto.
Demografa,
INE
Depto.
Demografa,
INE
Decenio
19922002
Depto.
Demografa,
INE
Anual
2010
Anual
2010
Decenio
2002
Ficha de
Proteccin
Social,
Ministerio de
Desarrollo
Social
Ficha de
Proteccin
Social,
Ministerio de
Desarrollo
Social
Censo de
42
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Variable
Poblacin Rural
Porcentaje de
Asistencia Escolar
Comunal
Tasa de pobreza
histrica
Descripcin
que posee la comuna respecto
al total de poblacin comunal.
Se entiende por poblacin rural
a toda aquella poblacin que
vive en asentamientos de
menos de 2000 habitantes, o
en aquellos que poseen menos
de 1000 (Poblacin Rural /
Poblacin Comunal Estimada
para el Ao)
A mayor valor del indicador,
mayor ser el nivel de
asistencia de los alumnos de
colegios municipales de la
comuna. Asistencia Promedio
Mensual Establecimientos
Municipales de Educacin /
Promedio Mensual de nios
matriculados
Promedio de pobreza 3 aos
anteriores disponibles.
Periodicidad
Ultimo
ao
disponible
Fuente
Poblacin y
Vivienda,
Instituto
Nacional de
Estadsticas
(INE)
Mensual
2012
SINIM,
Subdere
Bi anual o
trienal
2011
Encuesta
Casen,
Ministerio de
Desarrollo
Social
43
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Anexo 2
Resultados de la regresin por Mnimos Cuadrados Ordinarios (MCO)
Yi
estandandarizados.
Betas MCO ( )
MCO
Remuneraciones promedio
-0,09575646
-0,21927953
de los trabajadores
dependientes (log)
3,52**
3,52**
% pobreza histrica
(arcsin)
0,49548266
0,48474029
7,92**
7,92**
% poblacin rural
(arcsin)
-0,13409847
-0,39252745
4,96**
4,96**
% poblacin analfabeta
(arcsin)
0,40349163
0,25176513
2,57*
2,57*
% asistencia escolar
(arcsin)
-0,21883535
-0,0938032
2,23*
2,23*
0,03442978
0,08671043
2,11*
2,11*
0,03882056
0,12474226
2,67**
2,67**
0,105632
0,28328927
6,04**
6,04**
1,61477028
-0,00203088
4,24**
0,06
Observaciones
235
235
R-cuadrado ajustado
0,67
0,67
regin 7 (=1)
regin 8 (=1)
regin 9 (=1)
Constante
44
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Anexo 3
Grfico de residuos del modelo de regresin
Grfico 2
Cuartiles de residuos estandarizados vs
cuartiles de una distribucin normal
-.1
Residuals
.2
-.2
.1
0
-4
-2
0
res
-.2
-.1
0
Inverse Normal
.1
.2
-2
-1
Grfico 3
Homocedasticidad de los residuos
Residuals
Density
.3
.1
.4
.2
Grfico 1
Distribucin errores estandarizados
(lnea azul)
-3
-2
-1
Fitted values
45
Procedimiento de Clculo de la Tasa de Pobreza a nivel Comunal, mediante la aplicacin Metodologa SAE
Tabla 1
Coeficientes de correlacin de Spearman () para el cuadrado
de los residuos estandarizados
de
t-estadstico
Covariables
Sperarman
asinttico
Remuneraciones promedio de
los trabajadores dependientes
-0.0144
0.8264
% pobreza histrica
-0.0148
0.8214
% poblacin rural
-0.0065
0.9214
% poblacin analfabeta
-0.0092
0.8882
% asistencia escolar
0.0072
0.9126
regin 7
0.0337
0.607
regin 8
-0.095
0.1467
regin 9
-0.0061
0.9256
46