Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DE SEGURIDAD CIUDADANA
ENUSC 2016
Marzo /2017
DEPARTAMENTO DE INVESTIGACIÓN Y DESARROLLO
SECCIÓN ESTADÍSTICAS SOCIALES
Así, el objetivo de la ENUSC es obtener información sobre la percepción de inseguridad, la reacción frente
al delito y la victimización de personas y hogares a partir de una muestra representativa de zonas urbanas
a nivel nacional y regional. De este modo la ENUSC constituye uno de los pilares del sistema de
información para el diseño y seguimiento de las políticas de prevención y control del delito.
Durante el año 2016 se firma nuevamente un convenio entre el Ministerio y el INE para realizar la
decimotercera versión (ENUSC XIII), la cual es levantada en el área urbana de 101 comunas del país, con
el objetivo de recabar información que permita generar un conocimiento permanente de la variabilidad
de la victimización y sus consecuencias en la vida cotidiana de la población.
1
Cabe hacer notar que si bien, la encuesta se levanta desde el año 2003, es a partir del año 2005 cuando comienza a levantarse
en forma anual.
Esta incorporación al cálculo del tamaño muestral, no afecta la comparabilidad de la serie, y evita el
sesgo potencial que involucra el reemplazo de viviendas por otras que podrían tener características
diferentes a las originalmente consideradas en la muestra.
La selección de las unidades muestrales se obtuvo del marco de muestreo correspondiente al Marco
Muestral Maestro, en adelante, MMM, que cuenta con información parcialmente actualizada al año
2015.
El presente informe contiene una descripción metodológica del diseño muestral de la nueva versión de
la encuesta (ENUSC XIII), incluyendo las características del marco muestral, el cálculo del tamaño, los
métodos de selección de las unidades, la forma de expandir los datos, y la estructura de los estimadores
y su varianza.
2
http://unstats.un.org/unsd/publication/seriesf/Seriesf_98s.pdf, página 124.
Para este estudio se tomó como base muestral el MMM, el cual se encuentra formado por el universo
de límites geográficos fijos, denominados manzanas, de las cuales se dispone de información cartográfica
y del número de viviendas contenidas en cada una de ellas, según información recabada en el Censo de
Población y Viviendas del año 2002, parcialmente actualizada al año 2015.
Esta actualización parcial responde a un importante crecimiento demográfico en el área urbana del país,
que ha sido posible detectarlo a través de las enumeraciones de las muestras de las múltiples encuestas
que levanta el INE. Dado lo anterior, en el año 2014, el Ministerio de Desarrollo Social firma un convenio
con el INE para actualizar una parte del marco desde donde se extraería la muestra de la Encuesta de
Caracterización Socioeconómica CASEN 2015. Esta actualización corresponde a 2.351 manzanas, que
equivale a 1,96% de un total de 119.970 manzanas que posee el marco; y a 9,7% de un total de 24.182
manzanas que poseen las 61 comunas elegidas para la actualización. La elección de estas 61 comunas se
debe a que eran las que presentaban mayor cantidad de manzanas no elegibles, ya fuera por motivos de
cambio de estructura, o por crecimiento o decrecimiento en cuanto el número de viviendas que las
componen.
La actualización del marco se realiza mediante registros administrativos provenientes de los permisos de
edificación de las nuevas construcciones, otorgadas mensualmente por las direcciones de obras de las
municipalidades, que captura el Formulario Único de Edificación del INE, lo que permite precisar el
Dentro del marco, cada manzana se encuentra organizada en forma jerárquica. Tal organización se
denomina División Político Administrativa, donde las unidades corresponden en forma descendente a:
Región, Provincia y Comuna4. A su vez, cada manzana se encuentra estratificada por grupos de tamaño,
los cuales fueron creados según el número de viviendas que contienen. Estos grupos van del 1 al 5. El
número mínimo de viviendas por manzana para ENUSC en el marco, corresponde a 8 viviendas en el
primer grupo; y el máximo, a 846 en el último grupo. Según esto, el número mínimo de viviendas a
encuestar corresponde a 4 viviendas dentro del primer grupo, y el máximo, a 31 viviendas dentro del
último grupo.
La cobertura geográfica de este marco corresponde al área urbana de 101 comunas seleccionadas por el
ministerio, que se han venido levantando en los últimos años.
Desde este marco muestral se seleccionan las unidades primarias de muestreo (manzanas), las que son
“enumeradas” para luego seleccionar las unidades secundarias de muestreo (viviendas) de entre todas
las viviendas particulares ocupadas dentro de cada manzana. Luego, una vez en la vivienda seleccionada,
se procede a elegir a un representante de la vivienda, de 15 años o más, quien responderá por todos los
miembros de su hogar.
Según lo anterior, el diseño da origen a la selección de una muestra trietápica a seleccionar desde el
marco, cuyas etapas son:
4 Cabe señalar que este marco contiene sólo el área urbana de las comunas.
Cabe señalar que en esta versión se enumeró aproximadamente el 40% a nivel comunal del total de
manzanas seleccionadas en la muestra. Para el 60% restante se utilizó información de enumeraciones
anteriores. El detalle del número de manzanas enumeradas y extraídas desde otras enumeraciones a
nivel comunal, se muestra a continuación:
n° de Manzanas
Región Comuna 40% 60% Total
Enumerada Antiguo
1 ALTO HOSPICIO 16 24 40
1 IQUIQUE 22 32 54
2 ANTOFAGASTA 36 52 88
2 CALAMA 31 46 77
2 TOCOPILLA 12 17 29
3 COPIAPO 60 86 146
3 VALLENAR 41 61 102
4 COQUIMBO 31 43 74
4 ILLAPEL 13 20 33
4 LA SERENA 33 45 78
4 LOS VILOS 12 17 29
4 OVALLE 20 29 49
5 CALERA 10 16 26
5 CONCON 10 15 25
5 LIMACHE 10 15 25
5 LOS ANDES 12 20 32
5 QUILLOTA 11 15 26
5 QUILPUÉ 14 21 35
5 SAN ANTONIO 12 17 29
5 SAN FELIPE 8 11 19
5 VALPARAISO 24 37 61
5 VILLA ALEMANA 15 23 38
5 VIÑA DEL MAR 29 42 71
6 RANCAGUA 28 42 70
6 RENGO 11 15 26
6 SAN FERNANDO 12 17 29
6 SAN VICENTE 12 18 30
7 CAUQUENES 10 18 28
7 CONSTITUCION 9 15 24
7 CURICÓ 20 30 50
7 LINARES 15 23 38
7 MOLINA 13 20 33
7 TALCA 28 40 68
8 CHIGUAYANTE 8 11 19
8 CHILLAN 13 19 32
8 CONCEPCION 16 24 40
8 CORONEL 15 22 37
8 HUALPEN 12 18 30
8 LOS ANGELES 11 17 28
8 LOTA 15 19 34
8 PENCO 6 9 15
8 SAN CARLOS 6 10 16
8 SAN PEDRO DE LA PAZ 11 17 28
8 TALCAHUANO 14 21 35
8 TOMÉ 8 11 19
9 ANGOL 17 24 41
9 PADRE LAS CASAS 15 20 35
9 TEMUCO 37 56 93
9 VILLARRICA 7 10 17
10 ANCUD 6 10 16
10 CASTRO 8 11 19
10 OSORNO 21 31 52
La población objetivo la constituyen las personas de 15 o más años que componen los hogares que
habitan las viviendas particulares ocupadas, siendo seleccionada una de ellas para responder esta
encuesta.
Con base en la información del MMM se seleccionará una muestra de tamaño m, siendo
𝑘2𝑆2
𝑚 = 2 𝐷𝑒𝑓𝑓 = 32.238 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎𝑠
𝑒
donde:
k : Percentil de la distribución Normal asociado a un intervalo de confianza bilateral del 95% (este valor
corresponde a 1,96).
S 2 : Varianza de la variable de interés.
e : Error absoluto requerido para la precisión deseada.
Deff : Factor de ajuste del muestreo trietápico llamado Efecto del Diseño.
A continuación, se presentan los errores teóricos, a nivel nacional y regional, asociados a la prevalencia
de la variable de interés mencionada anteriormente, para un tamaño muestral teórico correspondiente
a 25.889 vivienda5s.
Cuadro n°2. Errores Teóricos asociados a la variable de interés según Tamaño Muestral Objetivo
5
Es importante mencionar que la estimación de errores debe ser obtenida desde el tamaño objetivo y no del tamaño
sobredimensionado, pues dadas las pérdidas naturales de unidades muestrales, se espera obtener un tamaño de 25.889
viviendas.
A continuación, se presentan los errores efectivos, a nivel nacional y regional, asociados a la prevalencia
de la variable de interés, para tamaño muestral efectivo correspondiente a 25.227 viviendas.
Cuadro n°3. Errores Efectivos asociados a la variable de interés según Tamaño Muestral Efectivo
Unidades de Primera Etapa (UPE): La selección de las Unidades de Primera Etapa (manzanas), en cada
una de las comunas pertenecientes a la muestra, y dentro de cada grupo de tamaño, se efectúa en forma
aleatoria y con igual probabilidad.
Esto quiere decir que, a fin de optimizar la selección de las manzanas, en el sentido de elegir tanto
manzanas grandes como pequeñas, dentro de cada comuna, se realizó una estratificación que clasifica
a las manzanas del marco en grupos de tamaño, que dependen del número de viviendas que contienen.
Luego, la probabilidad de inclusión de la i −ésima manzana, dentro de cada comuna h por grupo de
tamaño g, es igual a
𝑛ℎ𝑔
𝑃ℎ𝑔 (𝑖) =
𝑁ℎ𝑔
donde:
Unidades de Segunda Etapa (USE): Esta etapa se realiza una vez finalizado el proceso anterior y consiste
en la selección de viviendas en cada manzana de la muestra. Este procedimiento implica una selección
aleatoria de forma sistemática con igual probabilidad para todas las viviendas particulares ocupadas.
𝑚ℎ𝑔𝑖
𝑃ℎ𝑔 (𝑗|𝑖) =
𝑀′ℎ𝑔𝑖
siendo:
Unidades de Tercera Etapa (UTE): Se seleccionan utilizando el método de Kish escogiendo a una persona
de entre todas las personas de 15 o más años que habitan la vivienda (ver Anexo 2).
Al interior de cada vivienda seleccionada, se ordenan y listan las personas de 15 y más años, de acuerdo
al sexo y edad7, siendo listados primero los hombres y luego las mujeres en orden de mayor a menor,
respectivamente. Luego, la probabilidad de seleccionar a la persona k al interior de la vivienda j está
dado por:
1
Phgi (k/j) =
Thgij
Donde
Thgij : Total de personas aptas para responder la encuesta, que residen en la vivienda 𝑗, de la
manzana 𝑖 del estrato de tamaño 𝑔 en la comuna ℎ.
6 Puede ocurrir que, en el proceso de enumeración, alguna de las manzanas seleccionadas, tenga un número distinto de
viviendas al reportado por el marco (MMM), en este caso, se anota el nuevo número de viviendas y se registra bajo la
denominación M’hgi. En caso de no haber cambios, M’hgi = Mhgi (Número de viviendas en el MMM). Para las manzanas que no
fueron enumeradas, se utiliza la información de enumeraciones anteriores.
7
Se excluyen del listado el personal de servicio doméstico puertas adentro y todas aquellas personas que no se encuentren
aptas para responder.
8 El tamaño muestral de viviendas se encuentra con sobremuestreo para contrarrestar los efectos de la pérdida de muestra. La
El factor de expansión, según el diseño muestral, corresponde al aplicado a una muestra en tres etapas.
Este depende del número total de personas dentro de la vivienda encuestada, el número de viviendas
que tiene la manzana y el número de manzanas que tiene cada comuna por grupo de tamaño.
El objetivo de este ajuste en el factor de expansión, es llegar a los totales poblacionales de viviendas
sobre los cuales se seleccionó la muestra, es decir, al total de viviendas del marco muestral.
Luego, se realiza un suavizamiento del factor ajustado, como medida de mitigación para los factores,
cuando estos, debido a los ajustes que se les van realizando, aumentan significativamente su
variabilidad. Para esto se utiliza la principal variable de interés, sobre la cual se identifica el umbral de
suavizamiento a través de la minimización del error cuadrático medio.
Finalmente, el factor resultante es ajustado por la población de personas a nivel comunal o regional,
según las proyecciones de población, por sexo y tramo de edad9, actualmente utilizadas en todas las
encuestas que levanta el INE, y correspondientes al período de referencia de la encuesta.
Estas proyecciones son calculadas por el Subdepartamento de Estadísticas Demográficas del INE, con
base en la información recabada del Censo de Población y Viviendas del año 2002, ajustadas según datos
Dadas las probabilidades de selección de las unidades de primera y segunda etapa (manzanas y
viviendas respectivamente), el Factor de Expansión se calcula como el producto entre los inversos de
dichas probabilidades, según la siguiente fórmula:
𝑁ℎ𝑔 𝑀′ℎ𝑔𝑖
𝑤ℎ𝑔𝑖𝑗 = ∙
𝑛ℎ𝑔 𝑚ℎ𝑔𝑖
Donde:
𝑛ℎ𝑔 : Número de manzanas seleccionadas en la comuna ℎ del grupo de tamaño 𝑔.
𝑁ℎ𝑔 : Número de manzanas en el marco en la comuna ℎ del grupo de tamaño 𝑔.
𝑚ℎ𝑔𝑖 : Número de viviendas en la muestra en la manzana 𝑖 de la comuna ℎ del grupo de tamaño 𝑔.
𝑀′ℎ𝑔𝑖 : Número actualizado de viviendas en la manzana 𝑖 de la comuna ℎ del grupo de tamaño 𝑔.
Una vez calculado el Factor de Expansión que da cuenta de 2 etapas de selección, se realiza un ajuste
de No Respuesta, dado el diseño muestral utilizado. El método de ajuste consta de las siguientes etapas:
1. Se estima el total de viviendas por comuna y grupo de tamaño según la muestra. La forma de
cálculo es:
ℎ,𝑔
𝐸𝑠𝑡_𝑉𝑖𝑣𝑇𝑜𝑡𝑎𝑙𝑒𝑠 = ∑ 𝑉𝑖 ∗ 𝑤ℎ𝑔𝑖𝑗
𝑖
Donde:
2. Se estima el total de viviendas de elegibilidad conocida por comuna y grupo de tamaño según la
muestra. La forma de cálculo es:
ℎ,𝑔
Donde:
𝑉𝑖_𝐸𝑙𝑒𝑔_𝑐𝑜𝑛𝑜𝑐 : vivienda i dentro de cada comuna h por grupo de tamaño g, clasificada como “elegibilidad
conocida” según los códigos de disposición final, provenientes de la Hoja de Ruta.
𝐸𝑠𝑡_𝑉𝑖𝑣𝑇𝑜𝑡𝑎𝑙𝑒𝑠
𝐴𝑗𝑢𝑠𝑡𝑒𝐸𝑙𝑒𝑔_𝐷𝑒𝑠𝑐 =
𝐸𝑠𝑡_𝑉𝑖𝑣𝐸𝑙𝑒𝑔_𝐶𝑜𝑛𝑜𝑐𝑖𝑑𝑎
∗
𝑤ℎ𝑔𝑖𝑗 = 𝑤ℎ𝑔𝑖𝑗 ∗ 𝐴𝑗𝑢𝑠𝑡𝑒𝐸𝑙𝑒𝑔_𝐷𝑒𝑠𝑐
ℎ,𝑔
∗
𝐸𝑠𝑡_𝑉𝑖𝑣𝐸𝑙𝑒𝑔𝑖𝑏𝑙𝑒𝑠 = ∑ 𝑉𝑖_𝑒𝑙𝑒𝑔 ∗ 𝑤ℎ𝑔𝑖𝑗
𝑖
Donde
𝑉𝑖_𝑒𝑙𝑒 : vivienda i dentro de cada comuna h por grupo de tamaño g clasificada como “elegible”.
ℎ,𝑔
∗
𝐸𝑠𝑡_𝑉𝑖𝑣𝑅𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑛 = ∑ 𝑉𝑖_𝑟𝑒𝑠𝑝 ∗ 𝑤ℎ𝑔𝑖𝑗
𝑖
7. Se calcula el ponderador por “No Respuesta”, utilizando las estimaciones de los puntos 5. Y 6.
La forma de cálculo es:
𝐸𝑠𝑡_𝑉𝑖𝑣𝐸𝑙𝑒𝑔𝑖𝑏𝑙𝑒𝑠
𝐴𝑗𝑢𝑠𝑡𝑒𝑁𝑜 𝑅𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎 =
𝐸𝑠𝑡_𝑉𝑖𝑣𝑅𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑛
∗∗ ∗
𝑤ℎ𝑔𝑖𝑗 = 𝑤ℎ𝑔𝑖𝑗 ∗ 𝐴𝑗𝑢𝑠𝑡𝑒𝑁𝑜 𝑅𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎
Una vez calculado el Factor de Expansión ajustado por No Respuesta, se procede a incorporar la tercera
etapa, que da cuenta de la selección de las personas dentro de las viviendas. La forma de cálculo es la
siguiente:
∗∗∗ ∗∗
𝑤ℎ𝑔𝑖𝑗 = 𝑤ℎ𝑔𝑖𝑗 ∗ 𝑇ℎ𝑔𝑖𝑗
Donde:
Cabe señalar que debido a los ajustes que se le realizan al factor de expansión, este aumenta
significativamente su variabilidad. Para esto se utiliza la principal variable de interés, a saber: VA_DC:
Victimización Agregada de Delitos Consumados, sobre la cual se identifica el umbral de suavizamiento a
través de la minimización del error cuadrático medio a nivel comunal.
Según el procedimiento descrito en el siguiente capítulo, de los ejercicios realizados, el valor mínimo del
Error Cuadrático Medio en cada comuna, se alcanza cuando el ponderador es truncado a 6 veces la
media. Luego, el factor a suavizar es el correspondiente al que involucra las 3 etapas (selección de
manzanas, viviendas y personas). Una vez suavizado, el factor será ajustado por población para alcanzar
mayor precisión en las estimaciones de las principales variables que se miden en la encuesta.
𝑆∗∗∗
El Factor suavizado, será denotado por: 𝑤ℎ𝑔𝑖𝑗
Si bien para el cálculo de las estimaciones de las variables de interés se ocupa el factor regional, en
esta sección se describe la forma de cálculo del factor comunal, pues éste es requerido como insumo
para el cálculo de dicho factor regional.
Cabe señalar que no es posible emplear el factor comunal para efectuar estimaciones a este nivel,
debido que la encuesta ha sido diseñada para ser representativa a nivel nacional y regional, por
tanto, su cálculo se utiliza sólo como un paso intermedio para llegar a la región (que luego es
ajustado por la población a ese nivel).
𝑃𝑆ℎ≥15𝑎ñ𝑜𝑠
𝑤ℎ𝑔𝑖𝑗_𝐶 = 𝑤𝑆∗∗∗
ℎ𝑔𝑖𝑗 ∗ 𝑆
̂
𝑃ℎ≥15𝑎ñ𝑜𝑠
Donde:
i j
Corresponde al factor de expansión de Personas, ajustado por la población de 15 o más años a nivel
regional:
𝑃𝑆𝑟≥15𝑎ñ𝑜𝑠
𝑤ℎ𝑔𝑖𝑗_𝑟 = 𝑤ℎ𝑔𝑖𝑗_𝐶 ∗ 𝑆
̂𝑟≥15𝑎ñ𝑜𝑠
𝑃
donde:
𝑤ℎ𝑔𝑖𝑗_𝐶 : Factor de expansión de Personas ajustado por la población de 15 o más años, de sexo S, a
nivel comunal.
Siendo
PˆrS15 años w hgij_C
hr i j
Al ser el hogar inherente a las personas, seleccionar un individuo conlleva, de forma implícita, la
selección de uno de los hogares al interior de las viviendas.
En este contexto, podría definirse una probabilidad de selección del hogar, aun cuando sabemos
que esto no es una etapa adicional del diseño. Luego, la probabilidad de seleccionar al hogar “l”
(P_hgij (l)), en la vivienda j, de la manzana i perteneciente al grupo g y comuna h, puede ser
expresado de la siguiente forma:
1
𝑤ℎ𝑔𝑖𝑗𝑙_𝐶 = 𝑤𝑆∗∗∗
ℎ𝑔𝑖𝑗 ∗
𝑇ℎ𝑔𝑖𝑗𝑙
Donde
𝑇ℎ𝑔𝑖𝑗𝑙 : Número de personas por hogar.
𝑃ℎ≥15𝑎ñ𝑜𝑠
𝑤ℎ𝑔𝑖𝑗𝑙_ℎ = 𝑤ℎ𝑔𝑖𝑗𝑙_𝐶 ∙
̂
𝑃ℎ≥15𝑎ñ𝑜𝑠
Donde
𝑃ℎ≥15𝑎ñ𝑜𝑠 : Proyección de población de 15 o más años en la comuna h.
𝑃̂ℎ≥15𝑎ñ𝑜𝑠 : Estimación de población de 15 o más años en la comuna h.
Y
Factor de Expansión para hogares a nivel Regional ajustado por población de 15 años o más:
Corresponde factor de expansión de hogares, ajustado por la población de 15 o más años a nivel
regional:
𝑃𝑟≥15𝑎ñ𝑜𝑠
𝑤ℎ𝑔𝑖𝑗𝑙_𝑟 = 𝑤ℎ𝑔𝑖𝑗𝑙_ℎ ∙
̂
𝑃𝑟≥15𝑎ñ𝑜𝑠
donde:
𝑤ℎ𝑔𝑖𝑗𝑙_ℎ : Factor de expansión de hogares ajustado por la población de 15 o más años a nivel
comunal.
Siendo
Pˆr 15 años whgijl_ h
h i j
Debido a las etapas de selección, los ponderadores iniciales a medida que se van ajustando, aumentan
significativamente su variabilidad. Como medida de mitigación se propuso realizar un suavizamiento en
dichos ponderadores. Para ello se requiere como insumo la principal variable de interés a medir que
permita identificar el umbral de suavizamiento a través de la minimización del error cuadrático medio.
En este contexto, la variable de interés que se midió es el indicador de victimización agregada calculado
por comuna. Para realizar esta metodología de suavizamiento se utilizó la base datos a nivel de
informante Kish, calculándose la prevalencia de dicha variable.
Una vez obtenida la estimación, se procedió a realizar el suavizamiento del ponderador a partir de la
implementación de las siguientes etapas:
i. Se inspeccionó la existencia de valores extremos de este, al interior de cada una de las comunas,
ii. Se determinó puntos de corte a partir de los cuales realizar el suavizamiento,
iii. Se suavizaron los valores extremos identificados,
iv. Se estimó el error cuadrático medio (ECM) para la variable de interés para los distintos puntos
de corte,
v. Se eligió la opción de corte que minimizaba dicho error,
𝑀ℎ𝑎 = 𝑎 ∗ 𝐹̅ ℎ , 𝑝𝑎𝑟𝑎 𝑎 = 4, 5, 6, 7, 8, 9, 10 ,
Donde,
𝑎 : Punto de corte en el cual se prueba el suavizamiento.
Ω𝑖 : Es el conjunto de viviendas seleccionadas en la manzana i.
Θ𝑔 : Es el conjunto de manzanas seleccionadas en el grupo de tamaño g.
Ψℎ : Es el conjunto de grupos de tamaño de la comuna h.
𝑛ℎ : Es el total de personas seleccionadas en la comuna h.
𝑡∗
Donde 𝑤ℎ𝑔𝑖𝑗𝑘 es el factor suavizado.
Esto es, aquellos ponderadores identificados como valores extremos son truncados al valor máximo
establecido (Mha = a ∗ F̅ h ), mientras que el peso “sobrante” de los ponderadores truncados es
distribuido sobre el resto de los ponderadores.
Luego, para determinar el punto de corte donde se realiza finalmente el suavizamiento, se calculó un
estadígrafo que diera cuenta del sesgo y de la variabilidad. Para esto se obtuvo el Error Cuadrático Medio
(ECM) asociado a la variable de interés. Como en esta encuesta se pretende caracterizar la proporción
de victimizados, se calculó dicho indicador por región y su desviación típica. De esa forma el sesgo y el
ECM, respectivamente, se calculan como:
𝑠𝑒𝑠𝑔𝑜(𝑃̂𝑟𝑎 ) = 𝑃𝑟 − 𝑃̂𝑟𝑎
𝐸𝐶𝑀(𝑃̂𝑟𝑎 ) = 𝑆𝑒𝑠𝑔𝑜2 (𝑃̂𝑟𝑎 )
+ 𝑉𝑎𝑟(𝑃̂𝑟𝑎 )
Siendo,
10
Truncar a nivel comunal, se refiere al proceso analítico que consiste en primer lugar analizar la distribución de todos los
ponderadores (valores) que toman los factores de expansión de la comuna y luego determinar un rango mínimo y máximo para
estos ponderadores (lo que también se denomina como umbral de suavizamiento). En este caso, en un segundo tiempo, todos
los ponderadores de los factores de expansión que están por encima del umbral de suavizamiento definido, se reemplazan por
el valor máximo definido en dicho suavizamiento. Luego se reparte la diferencia (de ponderación) “sobrante”, entre los
ponderadores que están por debajo del umbral, a nivel comunal. Mediante este procedimiento, se logra conservar la estimación
del número de viviendas del diseño muestral original, coincidente con el parámetro establecido por el marco muestral.
yhijkc : Valor de la variable Y medida en la persona k, que cumple con la condición c y que pertenece a
la vivienda j, de la manzana i, en la comuna ℎ.
yhijc : Valor de la variable Y medida en la vivienda j, que cumple con la condición c y que pertenece a
la manzana i, en la comuna ℎ.
𝑤ℎ𝑔𝑖𝑗 : Factor de Expansión por persona asociado a la vivienda j de la manzana i en la comuna ℎ, según
corresponda (comunal o regional)
𝑤ℎ𝑔𝑖𝑗𝑙 : Factor de Expansión por hogar asociado a la manzana i en la comuna ℎ, según corresponda
(comunal o regional)
Estimación regional del total para la variable “y”, a nivel de personas de 15 o más años:
P̂ R whgij
h i j k
Estimación regional del número total de personas de 15 o más años con el atributo “C”:
donde:
Ĥ R whgijl
h i j
donde:
La estimación de razones o proporciones para personas de 15 o más años (u hogares) se obtiene a partir del
cociente entre los totales estimados para cada variable:
Personas:
i. Razón entre totales regionales estimados para todas las personas de 15 o más años:
xˆ P w [ xhijk ]
x
hgij Total Estimado de la var iable " x"
h i j k
ii. Razón entre totales regionales estimados para las personas de 15 o más años que cumplen la
condición C:
xˆ w
xc R
PC hgij [ xhijk ] Total Estimado de la var iable " x" en
h i j k
personas que cumplen la condicíón C
Hogares:
yˆ R
w hgijl [ yhij ]
Total Estimado de la var iable " y"
Rˆ HR
R h i j
xˆ H w
H _y x
hgijl [ xhij ] Total Estimado de la var iable " x"
h i j
iii. Razón entre totales regionales estimados para las personas de 15 o más años que cumplen la
condición C:
Total Estimado de la var iable " y" en
yˆ HR C w hgij [ yhijc ]
hogares que cumplen la condicíón C
Rˆ HR _ yc
h i j
xˆ w [ xhijc ]
xc R
HC hgij Total Estimado de la var iable " y" en
h i j
hogares que cumplen la condicíón C
Personas:
i. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de personas
de 15 o más años.
yˆ R
w hgij [ yhijk ]
Rˆ _Ry PR
h i j k
Pˆ w
p
hgij
h i j k
ii. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de personas
de 15 o más años que cumplen la condición “C”.
yˆ PR
w hgij [ yhijk ]
Rˆ R
R h i j k
iii. Razón entre el total regional estimado de la variable “Y” para personas de 15 o más años que
cumplen la condición “C” y el total regional estimado de personas de 15 o más años.
Pˆ w
p
hgij
h i j k
iv. Razón entre el total regional estimado de la variable “Y” para personas de 15 o más años que
cumplen la condición “C” y el total regional estimado de personas de 15 o más años que cumplen
la condición “C”.
Pˆ w
_ yc p
hgij
h i j k
i. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de hogares.
yˆ R
w hgijl [ yhij ]
Rˆ _Ry H PR
h i j
Hˆ w
h i j
hgijl
ii. Razón entre el total regional estimado de la variable “Y” y el total regional estimado de hogares que
cumplen la condición “C”.
yˆ R
w hgijl [ yhij ]
Rˆ PR
R h i j
Hˆ C w [ I hijc ]
_ y HC
hgijl
h i j
iii. Razón entre el total regional estimado de la variable “Y” para los hogares que cumplen la condición
“C” y el total regional estimado de hogares.
Hˆ w
H
hgijl
h i j
iv. Razón entre el total regional estimado de la variable “Y” para hogares que cumplen la condición “C”
y el total regional estimado de hogares que cumplen la condición “C”.
yˆ PRC
whgijl [ yhijc ]
Rˆ R
R h i j
h i j
Personas:
i. Razón entre el total regional estimado de personas de 15 o más años que cumplen la condición “B”,
y el total regional estimado de personas de 15 o más años que cumplen la condición “C”.
Pˆ R
w hgij [ I hijkb ]
Rˆ _RPb BR
h i j k
PˆC w
Pc
hgij [ I hijkc ]
h i j k
ii. Razón entre el total regional estimado de personas de 15 o más años que cumplen la condición “C”,
y el total regional estimado de personas de 15 o más años.
PˆCR
w hgij [ I hijkc ]
Rˆ R
R h i j k
Pˆ w
_ Pb P
hgij
h i j k
Hogares:
i. Razón entre el total regional estimado de hogares que cumplen la condición “B”, y el total regional
estimado de hogares que cumplen la condición “C”.
Hˆ BR
whgijl [ I hijb ]
Rˆ R
R h i j
h i j
ii. Razón entre el total regional estimado de hogares que cumplen la condición “C”, y el total regional
estimado de hogares.
Hˆ w
H
hgijl
h i j
Las fórmulas indicadas a continuación corresponden a la expresión matemática de cada varianza según
sea la estimación propuesta: totales o razones. En dichas fórmulas, las siguientes son las notaciones
utilizadas:
yhijkc : Valor de la variable Y medida en la persona k, que cumple con la condición c, en la vivienda j de la
manzana i en la comuna h.
R̂Ph : Corresponde a la razón entre el valor estimado de la variable “Y” (o el número estimado de
personas de 15 años o más que tienen el atributo) y el número estimado de personas de 15 años
o más en la comuna h.
R̂H h = Corresponde a la razón entre el valor estimado de la variable “Y” (o el número estimado de
hogares que tienen el atributo) y el número estimado de hogares en la comuna h.
3.2.1. Varianza del Total Estimado de la variable “y” para el nivel requerido
La varianza de una estimación de totales se obtiene sumando el algoritmo de las personas que tienen el
atributo.
Hogares:
nh
Vˆ (Y ) n
h i 1
[ whgijl ( yhi Rˆ H h H hi )]2
h
Personas:
nh
Vˆ ( P) n [whgij ( Phic Rˆ Ph Phi )]2
h i h 1
Hogares:
nh
Vˆ ( H ) n
h i 1
[ whgijl ( H hic Rˆ H h H hi )]2
h
La varianza de una tasa a nivel regional, TR, construida por la variable medida “YR” y el número de personas
(u hogares) “PR” está dada por:
1 Yˆ R
2
Yˆ R ˆ
Vˆ (T )
R
Vˆ (Y R ) Vˆ ( P R ) 2 COV (Y R , P R )
Pˆ
R 2
Pˆ R
Pˆ R
La Covarianza estimada entre las variables “YR” y “PR” se calcula a partir de la expresión siguiente:
Personas:
nh
COˆ V (Y , P) nh i 1
2
[whgij ( yhiPc Rˆ Ph Phi ) ( Phic Rˆ Ph Phi ]
h
Hogares:
nh
COˆ V (Y , H ) n 2
[whgijl ( yhiHc Rˆ H h H hi ) ( H hic Rˆ H h H hi ]
h i h 1
V (Yˆ )
V ( PROP )
P2
siendo en este caso, Y Pc , las personas de 15 o más años u Hogares que tienen el atributo y P Total
El coeficiente de variación de una estimación Z (total, razón o promedio) se obtiene del cociente entre la
desviación estándar de la estimación (raíz cuadrada de la varianza) y el valor de la estimación.
V ( Zˆ )
CVˆ ( Z )
Zˆ
Conocido este valor, en conjunto con la estimación, es posible determinar el intervalo de confianza en que
se mueve el parámetro poblacional. Para ello, se sugiere considerar un intervalo con 95% de confianza (k =
1,96). La expresión matemática es:
La siguiente tabla ilustra las agrupaciones de tamaño en relación a la cantidad de manzanas construidas
así como las viviendas a encuestar para esta ronda de la ENUSC según cada grupo de tamaño.
Grupo Manzanas con número de viviendas entre Viviendas a Encuestar
Tamaño
Mínimo Máximo Mínimo Máximo
1 8 23 4 6
2 24 44 9 13
3 45 81 15 20
4 82 154 25 27
5 156 846 30 31
El método de selección del informante utilizado en la Encuesta Nacional Urbana de Seguridad Ciudadana
está basado en el método Kish, el cual asigna la misma probabilidad de ser elegido como informante de
la encuesta a todos aquellos miembros de la vivienda que cumplen determinadas características.
Los pasos que se deben seguir para llevar a cabo dicha selección son los que se presentan a continuación:
Al llegar a la vivienda, el encuestador debe anotar en el Registro de Personas del Hogar (RPH) a todas
las personas que habitan la vivienda, identificando el número de hogares que la componen. El
ordenamiento de los miembros de la vivienda es por hogar, y dentro del hogar, es relacionado al
parentesco existente entre el jefe de hogar con cada uno de los individuos. Dentro de cada hogar, el
primer individuo en ser registrado es el jefe de hogar.
Luego de este ordenamiento, se debe realizar una enumeración de los potenciales informantes de la
encuesta, es decir, personas de 15 o más años que habitan la vivienda y que no forman parte del servicio
doméstico ni posean alguna discapacidad mental que les impida comprender las preguntas11.
La enumeración es a nivel de la vivienda, considerando todos los hogares y debiendo ordenar a los
integrantes de la vivienda según sexo y edad; primero los hombres de mayor a menor y luego las mujeres
de mayor a menor. Los menores de 15 años tampoco son considerados para la enumeración.
Ejemplo N°1:
Si se tiene una vivienda habitada por dos hogares, tales que: en el primer hogar habita el jefe de hogar
(52 años), la esposa (50 años), su mamá (65 años), una hija (24 años), un hijo (20 años) y un nieto (2
años)12, y en el segundo hogar habita el jefe de hogar (40 años), la conviviente (32 años) y una hija (10
años); la enumeración de los potenciales informantes queda dada por la columna “Informante Kish”.
Edad en
Nombre de Años Informante
Nº Línea Parentesco
Pila Kish
Cumplidos
1 Jorge 52 Jefe de Hogar 1
2 Rosa 50 Cónyuge 5
3 Angelina 24 Hija 7
4 Miguel 20 Hijo 3
5 Alejandro 2 Nieto -
6 Eliana 65 Madre 4
7 Aida 48 Servicio Doméstico -
9 Claudio 40 Jefe de Hogar 2
10 Ximena 32 Conviviente 6
11 Ester 10 Hija -
Las personas destacadas en color gris, corresponden a dos menores de 15 años y a una persona que
forma parte del servicio doméstico de la vivienda, por lo tanto, ninguno de ellos fue considerado como
posible informante. Los números de 1 a 7 señalados en la columna “Informante Kish” de la Tabla A2.1,
hacen referencia al ordenamiento por sexo y edad explicado previamente.
11 Ejemplos de estos casos son personas con Alzheimer, síndrome de Down, etc.
12 Los parentescos son con respecto al jefe de hogar.
La Tabla A2.2 es lo que denominamos Tabla Kish. En ella, la fila destacada en gris, y que muestra las
categorías 1 - 11 y 12 o más, da cuenta del número de personas de 15 o más años, que podrían ser
encontradas en la vivienda visitada, y que han sido clasificadas como posibles informantes (en base a los
criterios establecidos en el punto anterior). Por otro lado, la columna destacada en gris, y que muestra
las letras A – T, hace referencia a lo que se ha denominado como Letra Kish. Esta letra se asigna de forma
aleatoria a cada una de las viviendas seleccionadas en la muestra, y dicho procedimiento se presenta
más adelante.
TABLA DE KISH
La asignación de las letras Kish, se ha optado realizarla por comuna a través de las manzanas que la
conforman y que han sido seleccionadas para la muestra.
Con este propósito se han considerado 20 letras (A-T) que pueden ser asignadas a las viviendas y que se
han dispuesto del siguiente modo:
J K A T I L B S H M C R G N D Q F O E P
Dentro de cada comuna, y siguiendo esta disposición de letras, se comienzan a distribuir dichas letras a
través de las manzanas que fueron seleccionadas, terminando la asignación cuando la última vivienda a
encuestar, dentro de la última manzana de la comuna, ha recibido una letra. Este proceso se repite para
cada comuna que conforma la muestra, y cada vez que pasamos a una nueva comuna se retoma la
secuencia inicial, independiente de la letra en que se haya terminado en la comuna anterior. Un ejemplo
de esta asignación se muestra en la Tabla A2.3.
Ya conocido el proceso de registro de los individuos, quienes son los potenciales informantes y luego de
saber cómo es una tabla Kish y como se asignan las letras a cada vivienda, se procede a definir como
seleccionar al informante.
i) Asignar a cada vivienda una letra según los criterios establecidos en el punto 3 de este
anexo.
ii) Una vez logrado el contacto de la vivienda, se registran todos los individuos del hogar
en el RPH.
iii) Se enumeran los individuos de 15 o más años, siguiendo un orden dado por sexo y edad,
tal como se describió en el punto 1 de este anexo. No se enumeran los menores de 15
A continuación se presenta un ejemplo para ilustrar este procedimiento mostrando cada una de los
pasos para la selección del informante.
Paso i):
Paso ii):
Supongamos que la vivienda seleccionada en el paso “i” fue contactada y que el registro de las personas
que habitan en ella es el que se muestra a continuación:
Paso iv):
Como resultado de la enumeración del paso anterior hemos determinado que existen 8 potenciales
informantes en la vivienda.
TABLA DE KISH
N° Total de
TABLA DE KISH Potenciales
Informantes.
Si el número de personas de 15 o más años en la vivienda es:
Tabla
Aleatoria 12 o
1 2 3 4 5 6 7 8 9 10 11
más
Selecciónese a la persona de 15 o más años con el número:
A 1 1 1 1 1 1 1 1 1 1 1 1
B 1 1 1 1 1 1 1 1 1 1 1 2
C 1 1 1 1 1 1 1 1 2 2 2 2
D 1 1 1 1 1 2 2 2 2 2 2 3
E 1 1 1 1 2 2 2 2 3 3 3 3
F 1 1 1 2 2 2 2 3 3 3 4 4
G 1 1 1 2 2 2 3 3 3 4 4 5
H 1 1 2 2 2 3 3 3 4 4 5 5
I 1 1 2 2 3 3 3 4 4 5 5 6
J 1 1 2 2 3 3 4 4 5 5 6 6
K 1 2 2 3 3 4 4 5 5 6 6 7
L 1 2 2 3 3 4 5 5 6 6 7 7
M 1 2 2 3 4 4 5 6 6 7 7 8
N 1 2 3 3 4 5 5 6 7 7 8 8
O 1 2 3 3 4 5 6 6 7 8 8 9
P 1 2 3 4 4 5 6 7 7 8 9 10
Q 1 2 3 4 5 5 6 7 8 9 10 10
R 1 2 3 4 5 6 7 8 8 9 10 11
S 1 2 3 4 5 6 7 8 9 10 11 11
T 1 2 3 4 5 6 7 8 9 10 11 12
TABLA DE KISH
Esto quiere decir que, la persona que se debe elegir como informante Kish es Mario, etiquetado como
número tres en la columna “Informante Kish”, de 28 años de edad, hijo de uno de los jefes de hogar que
habita la vivienda a encuestar nº 2, de la manzana nº 24 de la comuna de Iquique.