Sei sulla pagina 1di 57

UNIVERSIDAD DE GRANADA

Mtodos de regresin no paramtrica en


muestreo en poblaciones nitas

Tutor:
Profesor Doctor D. Ismael Ramn Snchez Borrego
Autor
Teresa Zamora Garca
DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN
OPERATIVA

GRANADA

Junio de 2010

Trabajo presentado por Teresa Zamora Garca

Dirigido por Ismael Ramn Snchez Borrego

Mster ocial Trabajo de Investigacin tutelado


DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN
OPERATIVA

UNIVERSIDAD DE GRANADA

ndice general
1. Introduccin a la regresin no paramtrica.

1.1. Mtodos de regresin no paramtrica. . . . . . . . . . . . . . . .


1.1.1. Estimadores tipo ncleo de regresin. . . . . . . . . . . .
1.1.2. Splines de suavizamiento. . . . . . . . . . . . . . . . . . .
1.1.3. Regresin polinmica local. . . . . . . . . . . . . . . . . .
1.1.4. Otros mtodos. . . . . . . . . . . . . . . . . . . . . . . . .
1.1.5. Comparacin entre los diferentes mtodos. . . . . . . . . .
1.2. Seleccin del ancho de banda. . . . . . . . . . . . . . . . . . . . .
1.2.1. Criterios de error. . . . . . . . . . . . . . . . . . . . . . .
1.2.2. Selectores basados en la suma de cuadrados de los residuos.
1.2.3. Seleccin del ancho de banda ptimo. . . . . . . . . . . .
1.3. Estimador adaptado a las discontinuidades. . . . . . . . . . . . .
1.3.1. Estimador propuesto. . . . . . . . . . . . . . . . . . . . .

2. El estimador de Breidt y Opsomer (2000).

2.0.2. El estimador modelo-asistido de Breidt y Opsomer (2000).


2.1. Propiedades tericas del estimador de Breidt y Opsomer(2000). .
2.1.1. Peso y calibracin. . . . . . . . . . . . . . . . . . . . . . .
2.1.2. Diseo asintticamente insesgado y consistente. . . . . . .
2.1.3. Error cuadrtico medio asinttico. . . . . . . . . . . . . .
2.1.4. Normalidad asinttica. . . . . . . . . . . . . . . . . . . . .
2.1.5. Robustez. . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Seleccin del ancho de banda. . . . . . . . . . . . . . . . . . . . .
2.3. Estudio de simulacin. . . . . . . . . . . . . . . . . . . . . . . . .

4
4
5
6
7
7
8
9
10
11
14
16

18

18
22
22
22
24
26
27
28
30

3. Mtodos de regresin no paramtrica en el muestreo en poblaciones nitas.


34
3.1. Estimaciones basadas en el modelo. . . . . . . . . .
3.1.1. Estimador propuesto. . . . . . . . . . . . .
3.1.2. Propiedades del estimador. . . . . . . . . .
3.2. Estimaciones modelos-asistidas. . . . . . . . . . . .
3.2.1. Estimador adaptado a las discontinuidades.
3.3. Estimacin en presencia de puntos de cambio. . . .
3.3.1. Estudio de simulacin . . . . . . . . . . . .
1

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

34
35
35
37
37
40
41

NDICE GENERAL

3.4. Comparacin entre el estimador basado en el modelo y el estimador modelo-asistido. . . . . . . . . . . . . . . . . . . . . . . . .


3.5. Estimacin por calibracin de la funcin de distribucin empleando regresin no paramtrica. . . . . . . . . . . . . . . . . . . .
3.5.1. Modelo de calibracin estimado de la funcin de distribucin
3.5.2. Propiedades del estimador propuesto. . . . . . . . . . . .

4. Estudio Emprico.

43
43
44
46

47

Captulo 1

Introduccin a la regresin no
paramtrica.
En el estudio de las variables bidimensionales, y en general, de las multidimensionales puede resultar interesante investigar la posible existencia de una
relacin de dependencia entre las variables implicadas y la construccin de algn
modelo matemtico que permita describir dicha relacin, en el supuesto de que
sta exista.
El propsito del estudio de los modelos de regresin es construir modelos
matemticos que permitan explicar la relacin de dependencia existente entre
una variable respuesta Y y una o ms variables independientes. Podemos utilizar estos modelos como herramienta para predecir nuevos valores de la variable
respuesta a partir de cierto valor particular que ha tomado la variable explicativa. Es imprescindible el empleo de tcnicas de regresin no paramtrica cuando
se pretende predecir una variable respuesta que es imposible o muy costosa de
medir.
n
Dadas n observaciones de dos variables bidimensionales {(Xi , Yi )}i=1 , consideramos el modelo de regresin

yi = m(xi ) + i ,

i = 1, ..., n,

(1.1)

donde i son variables aleatorias independientes con media cero y varianza


constante, y m es una funcin de regresin desconocida. Podemos distinguir dos
tipos de modelos de regresin atendiendo a los supuestos que se establecen sobre
la funcin de regresin m;
Modelo de regresin paramtrica: que asume que la funcin de regresin
tiene forma predeterminada.
Modelo de regresin no paramtrica: que slo supone hiptesis de suavidad (en el sentido de continuidad y diferenciabilidad) sobre la funcin
de regresin m. Tampoco se asume ninguna forma predenida como las
anteriores para la funcin de regresin.
3

1.1. MTODOS DE REGRESIN NO PARAMTRICA.

La regresin no paramtrica tiene cuatro propsitos principales para estimar


una curva de regresin:
1. Proporcionar un mtodo verstil para estudiar la relacin general entre
dos variables.
2. Dar predicciones de las observaciones aunque ests no tengan referencia a
ningn modelo paramtrico jo.
3. Proporcionar una herramienta para encontrar falsas observaciones y as
estudiar la inuencia de los puntos aislados.
4. La creacin de un mtodo exible de substitucin para los valores faltantes
o de interpolacin entre los X-valores adyacentes.
En regresin no paramtrica destaca el estimador de la funcin de regresin llamado estimador lineal local, introducido entre otros por Fan and Gijbels
(1996), que destaca por sus buenas propiedades. Los mtodos no paramtricos
son ms apropiados cuando no se tiene conocimiento previo de la relacin entre
las variables objeto de estudio puesto que slo parten de supuestos de suavidad
sobre la funcin de regresin. Estos mtodos no paramtricos son computacionalmente costosos debido al gran nmero de operaciones que involucran y
son slo aplicables en la prctica con la ayuda de un programa informtico.

1.1. Mtodos de regresin no paramtrica.


Destacamos a continuacin tres de los mtodos ms conocidos en suavizamiento: estimacin tipo ncleo, splines de suavizamiento y la regresin polinmica local. Otros mtodos menos habituales tipo son los estimadores en serie ortogonal y los estimadores k-nearest-neighbor.

1.1.1. Estimadores tipo ncleo de regresin.


Los estimadores tipo ncleo son medias ponderadas de las observaciones yi .
Se denen como aquellos estimadores mh (x) de m en el punto x que responden

a una expresin del tipo:


n

mh (x) =

whi (x)yi ,

(1.2)

i=1
n

donde {whi }i=1 denota una sucesin de pesos que pueden depender del vector
n
completo {xi }i=1 . h es el llamado parmetro de suavizado, tambin conocido
por ancho de banda o ventana. Este parmetro tiene una gran importancia
para el rendimiento del estimador ncleo de regresin. Dependiendo de la eleccin de la funcin peso vamos a tener distintos subtipos de la clase general de
estimadores ncleo. As, la funcin

1.1. MTODOS DE REGRESIN NO PARAMTRICA.

Kh (x xi )
,
n
i=1 Kh (x xi )

whi (x) =

(1.3)

determina el estimador ncleo de NadarayaWatson, que se dene para


diseos aleatorios y est dado por:

mh (x) =

n
i=1 Kh (x xi )yi
,
n
i=1 Kh (x xi )

n1
n1

(1.4)

donde Kh () = h K h . La funcin K se denomina funcin ncleo, y determina qu peso se asigna a cada observacin dependiendo de su distancia a
x.
Habitualmente se elige K una funcin de densidad simtrica. La eleccin,
si

whi (x) =

Kh (u x)du,
si1

(1.5)

donde si = (xi + xi+1 )/2, s0 = 0, y sn = 1, conduce al estimador ncleo


de regresin para diseos jos de Gasser Mller, adaptacin del estimador de
PriestleyChao, y que est dado por:
n

si

i=1

si1

mh (x) =

Kh (u x)du yi ,

(1.6)

Los estimadores tipo ncleo que emplean estos pesos son tambin conocidos
por estimadores ncleo por convolucin.
La mayora de mtodos de regresin no paramtrica son asintticamente
equivalentes a la estimacin ncleo de regresin.

1.1.2. Splines de suavizamiento.


Los splines de suavizamiento son aquellos estimadores de la funcin de regresin que hacen mnima la funcin:
n

Sh (m) =

(yi m(xi )) + h
i=1

m (x)2 dx,

donde h denota el ancho de banda. La complejidad del acercamiento del spline


de suavizamiento est controlada por este parmetro. As, si h , nos aproximamos a un ajuste lineal por mnimos cuadrados.
El estimador resultante mh es un polinomio de grado tres en cada intervalo

(xi , xi+1 ). En (0, xi ) y (xn , 1), mh es lineal en las respuestas y l y sus dos

primeras derivadas son continuas sobre los xi . Por tanto, h es un spline cbico
con nodos en los puntos de diseo xi .
Los splines de suavizamiento son los estimadores de la funcin de regresin
ms complejos y difciles de manejar matemticamente hablando.

1.1. MTODOS DE REGRESIN NO PARAMTRICA.

1.1.3. Regresin polinmica local.


En regresin no paramtrica m se supone una funcin suave. Esto signica
que puede ser aproximada localmente por una funcin lineal.
Sea h el tamao de dicho entorno local. Suponemos que dado un punto x0 ,
si m(x0 ) tiene derivada de orden p-simo se tiene por el desarrollo de Taylor
que

m(x) m(x0 ) + m (x0 )(x x0 ) +


(p)

(x0 )
(x
p!

+ +
x0 )
p
j=0 j (x x0 )j ,

m (x0 )
(x
2!

x0 )2

(1.7)

para x en un entorno de x0 , y donde j = m(j) (x0 )/j!.


ste es ajustado polinmicamente para el problema de regresin de mnimos
cuadrados:
n
i=1

y
i

j (xi x0 )j
j=0

Kh (xi x0 ),

(1.8)

La idea bsica de una ajuste polinomial local es simple: en un entorno de x0 se


ajusta un polinomio de grado p a los datos y los p + 1 coecientes del ajuste
conducen a estimadores de = m() (x0 )/!, o equivalentemente a:

m = !

(1.9)

= 0, ..., p,

que es un estimador de m() , derivada v -sima de la funcin de regresin evaluada en x0 .

1
.
X= .
.
1
Sea

x1 x0
.
.
.

...
.
.
.

xn x0

...

(x1 x0 )p

.
.
= [1 xj xi
.
(xn x0 )p

y1
.
y= . y
.
yn

...

(xj xi )p ]j

U,

0
.
= .
.

(1.10)

y la matriz cuadrada de pesos W dada por

W = diag {Kh (xi x0 )} .

Finalmente, el estimador polinmico local est dado por = (X WX)1 X Wy .


El uso de algn tipo de estimador ncleo puede implicar algunos inconvenientes
como sucede, por ejemplo, con la varianza del estimador de Gasser-Mller en
un diseo aleatorio. El estimador de regresin polinomial local no presenta estos
problemas y se adapta satisfactoriamente a diseos jos y aleatorios.

1.1. MTODOS DE REGRESIN NO PARAMTRICA.

Adems, el estimador de regresin polinmico local no presenta el efecto


frontera. El sesgo en tal regin es de igual orden al existente en el interior,
por lo que, a diferencia de lo que sucede con otros mtodos de regresin no
paramtrica no se necesitan modicaciones del estimador en dicha regin.

1.1.4. Otros mtodos.


Un estimador k-nearest-neighbor se dene por:
n

mk (x) = n1

whi (x)yi ,

(1.11)

i=1
n

donde {whi }i=1 es una sucesin de pesos denida en el conjunto Jx = {i : xi es


una de las k observaciones ms prximas a x}.
Intuitivamente, el estimador k-nearest-neighbor es un estimador tipo ncleo
con ancho de banda variable, puesto que promedia las k observaciones ms
cercanas a cada punto de estimacin.
Bajo ciertas condiciones, la funcin de regresin admite un desarrollo or

togonal en la forma m(x) = j=0 j j (x), donde {j }j=0 son los coecientes

de Fourier y {j }j=1 es una base de funciones. Una vez jada dicha base, es
equivalente estimar m a estimar los coecientes de Fourier. El estimador en serie
ortogonal se dene entonces por:
hn

mh (x) =

j j (x),

j=0

donde hn es el parmetro de suavizamiento.


Ejemplos muy conocidos de bases de funciones son las formadas por los
polinomios de Laguerre y por los de Legendre.

1.1.5. Comparacin entre los diferentes mtodos.


Si el ancho de banda es elegido como una funcin apropiada del tamao
muestral n todos los estimadores presentados convergen a m a medida que crece
n.
Entre los estimadores tipo ncleo de regresin, el sesgo del estimador NadarayaWatson (1.4) adopta una expresin ms complicada que la del estimador tipo
ncleo por convolucin (1.6). Estos dos estimadores tienen igual varianza bajo
un diseo jo, aunque la varianza del estimador Nadaraya-Watson es ms favorable que la del estimador tipo ncleo por convolucin. Adems la eciencia
asinttica minimax del estimador Nadaraya-Watson mN W es igual a 0.

En un sentido minimax, el estimador tipo ncleo de regresin por convolucin


es ptimo bajo un diseo jo. Por otra parte, el estimador k-nearest-neighbor
alcanza su mejor rendimiento cuando f y m concuerdan; es decir, f es grande
cuando m lo es, y cuando ambas son pequeas.

1.2. SELECCIN DEL ANCHO DE BANDA.

El estimador tipo ncleo de regresin, en especial el estimador por convolucin puede constituir una buena eleccin por su sencillez matemtica y su fcil
interpretabilidad.
Aunque el estimador polinmico local es asintticamente equivalente al estimador tipo ncleo por convolucin en un diseo jo, bajo un diseo aleatorio
es superior en trminos de su varianza asinttica, permaneciendo igual su sesgo.
Esto unido al hecho de no necesitar correccin alguna pro el efecto frontera lo
convierten en una magnca eleccin entre los distintos estimadores de la funcin
de regresin.

1.2. Seleccin del ancho de banda.


La decisin del investigador sobre el grado de suavizamiento es decisiva.
Cada mtodo de suavizamiento depende de un parmetro cuya seleccin ptima
determina un equilibrio entre el grado de ajuste a los datos y la suavidad del
estimador.
Dado que un modelo de regresin no paramtrica establece hiptesis de suavidad sobre m, los puntos de un entorno de x contienen informacin sobre el valor
de m en x. Es posible, por tanto, hacer un promedio local de las observaciones
Yi con abscisa en tal entorno. sta es la idea bsica general del suavizamiento.
En cada punto de estimacin se hace un promedio local de las observaciones
Yi incluidas en una banda vertical con intervalo centrado en dicho punto. La
amplitud de la banda depende del valor del parmetro h, al que llamaremos
ancho de banda.
El ancho de banda h determina por tanto qu observaciones intervienen en
el clculo del promedio local. Si la seleccin de h es grande implicara emplear
muchas observaciones para calcular la estimacin de m en cada x, lo que conlleva
un aumento del sesgo de la estimacin y se obtiene un estimador con apariencia
de excesiva suavidad. En cambio, un valor de h pequeo reduce notablemente
el nmero de observaciones que inuyen en el promedio local y obtenemos un
estimador poco suavizado, y un aumento en la variabilidad en la estimacin.
Sera deseable contar con un mtodo de seleccin del ancho de banda que
proporcione anchos de banda ptimos, en el sentido de alcanzar un equilibrio
entre la varianza y el sesgo del estimador. Es decir, encontrar un valor de h que
haga posible un ajuste razonable a los datos sin que aumente excesivamente la
variabilidad del estimador. En general existen dos alternativas para conseguir
una cantidad justa de suavizamiento. Una eleccin subjetiva del ancho de banda que permite al investigador elegir el valor de h observando el diagrama de
dispersin. El inconveniente principal de este mtodo es que no puede ser automatizado y es difcil de emplear cuando trabajamos con observaciones de ms
de dos dimensiones. Sin embargo, un mtodo de seleccin del ancho de banda
dirigido por los datos permite elegir h de forma automtica y objetiva, y es de
gran utilidad en anlisis de regresin multivariante.
En la siguiente seccin presentamos algunas de las medidas ms conocidas
de seleccin automtica del ancho de banda.

1.2. SELECCIN DEL ANCHO DE BANDA.

1.2.1. Criterios de error.


En este apartado nos centramos en los mtodos automticos ms relevantes
de seleccin del ancho de banda en regresin no paramtrica.
Para analizar el comportamiento de un estimador tipo ncleo de regresin se
hace necesaria la especicacin de criterios de error que midan la precisin en la
estimacin. Cuanto menores sean los valores proporcionados por estos criterios
para un estimador dado, mejor ser dicha estimacin.
Podemos medir el error cometido en la estimacin en un nico punto o
mediante una medida de error global que permita conocer cmo se comporta el
estimador sobre el dominio completo de denicin de la funcin de regresin.
El criterio de error puntual ms habitual es el Error Cuadrtico Medio
(MSE), que se dene por:

M SE(h) = E[mh (x) m(x)]2 .

(1.12)

Entre las medidas globales, un criterio de error natural para estimadores de


la funcin de regresin es el Error Cuadrtico Integrado (ISE). Para un
estimador tipo ncleo con ancho de banda h, ISE est denido por:
b

ISE(h) =

w(x)[mh (x) m(x)]2 dx,

(1.13)

donde w es una funcin peso no negativa. Supongamos que esta funcin tiene
derivada segunda continua. w puede ser elegida de forma que sea constante en
el interior de su soporte [a, b] y 0 en una apropiada regin frontera de dicho
intervalo. Una razn fundamental para elegir esta funcin peso es que infrapondera los errores en la frontera, que habitualmente dominan el error cometido en
el interior del intervalo. Aunque existen situaciones en las que no es necesario
considerar tal funcin, su empleo simplica de forma drstica los desarrollos
tericos. Otra eleccin habitual de w es elegirla como la funcin de densidad f .
Una aproximacin discreta de ISE viene dada por el Error Cuadrtico
Promedio (ASE), que est dado por:
n

ASE(h) = n1

w(xi )[mh (xi ) m(xi )]2 ,

(1.14)

i=1

donde w es una funcin peso no negativa. Las respectivas funciones peso de

estas dos medidas de error estn relacionadas segn:

w(x) = w(x)f (x).

(1.15)

Una de las medidas de error ms empleadas es el Error Cuadrtico Inte-

grado Medio (MISE),

M ISE(h) = E[ISE(h)].

(1.16)

10

1.2. SELECCIN DEL ANCHO DE BANDA.

Otro criterio de error de inters es el Error Cuadrtico Promedio (MASE),


que est denido por:
n

M ASE(h) = n1

w(xi )E[mh (xi ) m(xi )]2 ,

(1.17)

i=0

que es E[ASE(h)].
Presentamos a continuacin algunos selectores del ancho de banda que consisten en la minimizacin de la suma de cuadrados de los residuos.

1.2.2. Selectores basados en la suma de cuadrados de los


residuos.
Desafortunadamente en la prctica no es posible seleccionar h haciendo mnimo alguno de los criterios anteriores, ya que no pueden ser calculados sin el
conocimiento previo de m. Por tanto debemos estimar el criterio considerado y
hacer mnima tal estimacin con respecto a h.
La suma de cuadrado de los residuos se escribe por:
n

w(xi )[yi mh (xi )]2 = n1 (y m(h))T W (y m(h)).

n1
i=1

Una medida de error que responde a esta construccin viene dada por la
funcin de validacin cruzada.
La funcin de validacin cruzada (CV) est basada en el estimador
mh,i (xi ) construido a partir de una submuestra de tamao n 1 tomada a

partir de los datos. Tal estimador es la estimacin mh (xi ) que no utiliza la

observacin isima yi . Tal criterio est dado por:


n

CV (h) = n1

w(xi )(yi mh,i (xi ))2 .

(1.18)

i=1

Esta medida, introducida en el contexto de la estimacin tipo ncleo, evita la


necesidad de conocer la funcin de regresin, as como el uso de la observacin
yi para el clculo del estimador de m.

Notamos por hCV el ancho de banda que hace mnima la funcin de validacin cruzada, es decir,

hCV = arg min CV (h).


h Hn

(1.19)

Si notamos por hASE el ancho de banda que hace mnimo ASE, hCV pro CV sufre una
porciona en general buenas aproximaciones a hASE . Sin embargo h
alta variabilidad y CV tiende a elegir anchos de banda muy pequeos.
Estos inconvenientes motivaron la introduccin del criterio de validacin
cruzada generalizada (GCV). Esta medida de error fue introducida en el
contexto del suavizamiento por splines, y se dene por:

11

1.2. SELECCIN DEL ANCHO DE BANDA.

2
yi mh (xi )

GCV (h) = n
w(xi )

tr W W S(h)
i=1
n

(1.20)

Se puede demostrar que tanto el criterio de validacin cruzada, como validacin


cruzada generalizada estn construidos mediante un factor de correccin.

1.2.3. Seleccin del ancho de banda ptimo.


Son muchos los selectores de anchos de banda propuestos que producen
suavizadores tipo ncleo asintticamente ptimos. La eleccin de tales selectores
conduce en general a resultados satisfactorios. Sin embargo, existen situaciones
en las que un selector dado tiene un rendimiento superior a otros. Es razonable
preguntarse qu selector emplear y cmo ser la convergencia entre el ancho de
banda seleccionada por un criterio de error dado y el ancho de banda ptimo.
Como estudiaremos a continuacin, todos los criterios de error presentados
son asintticamente equivalentes y la velocidad de convergencia de un ancho de
banda estimado al ancho de banda ptimo es considerablemente lenta.

Denicin 1.1 Si d es una medida de error cualquiera, se dice que h es asintticamente ptimo respecto de d si la probabilidad de que
l
m

h
nf

d(h)
=1
Hn d(h)

es igual a uno, donde Hn es un conjunto de ndices.


Se ha demostrado que el criterio de validacin cruzada proporciona anchos de
banda asintticamente ptimos. Adems, CV no tiene en cuenta a qu clase de
funciones pertenece m.
Desde un punto de vista prctico, esta propiedad es til puesto que permite
emplear este criterio sin necesidad de tomar en consideracin la suavidad de la
verdadera funcin de regresin.
Suponemos por simplicidad que los puntos de diseo estn igualmente espaciados en el intervalo unidad. Consideramos el estimador tipo ncleo de PriestleyChao, con ncleo K simtrico, con soporte compacto y derivada segunda continua en el sentido Hlder. Suponemos tambin que m tiene derivada segunda
uniformente continua e integrable y que existen todos los momentos de los errores i , que se suponen variables aleatorias independientes e idnticamente
distribuidas con media 0 y varianza desconocida 2 .

Llamamos ancho de banda ptimo al parmetro hM ASE que hace mnimo


ASE(h).
Asimismo denotamos por hM ASE al parmetro que hace mnimo M ASE(h).
Vamos a comparar ambos anchos de banda deduciendo su razn de convergencia a 0.

El siguiente teorema arma que hM ASE y hM ASE son elecciones de ancho


de banda equivalentes.

12

1.2. SELECCIN DEL ANCHO DE BANDA.

Teorema 1.1 Si m tiene derivada segunda uniformente continua e integrable


y existen todos los momentos de los i , entonces los criterios de error ASE(h)

y M ASE(h) pueden ser aproximados por una medida d dada por:

d(h)

= n1 h1 2

K 2 du +

w(u)du
2

+ h4

u2 K(u)/2du

(m (u))2 w(u)du,

(1.21)

en el sentido de que
sup
h Hn

ASE(h) d(h)
M ASE(h) d(h)
+

d(h)
d(h)

0,

en probabilidad cuando n , donde Hn = [n1+ , n] para un arbitrariamente pequeo.

Por tanto, hM ASE y hM ASE son aproximadamente iguales a h, parmetro que



hace mnima d. h est dada por:

h = Cn1/5

(1.22)

donde

C=

2 ( w(u)du)( K 2 du)
2 K(u)du)2 (m (u))2 w(u)du
( u

1/5

Como consecuencia del teorema, podemos escribir

hM ASE

hM ASE
1,

(1.23)

en probabilidad.

Desafortunadamente esta expresin de h no es vlida como aproximacin al


ancho de banda ptimo, puesto que est en funcin de las cantidades desconocidas 2 y m . Para superar esta dicultad podemos estimar tales cantidades

e insertar dichas estimaciones en la expresin de h. Emplear un procedimiento


tal para la seleccin del ancho de banda es emplear una tcnica que recibe el
nombre de tcnica plug-in.
No obstante, emplear estas tcnicas en esta situacin no resuelve el problema
planteado en puntos de inexin y en aquellas en los que m sea o se aproxime
a una funcin lineal; esto es, en puntos que cumplan que m (x) = 0.
Como comentamos anteriormente, los mtodos de seleccin del ancho de
banda que responden a una construccin en la que p(h) es multiplicado por un
factor de correccin son asintticamente equivalentes. Cabe pensar por tanto
que los comportamientos de tales mtodos son aproximadamente los mismos
para tamaos muestrales elevados.

13

1.2. SELECCIN DEL ANCHO DE BANDA.

Se puede demostrar que los anchos de banda seleccionados por estas medidas

de error son asintticamente ptimos. As, si h es el parmetro de suavizado que


hace mnimo alguno de estos criterios se verica que:

ASE(h)
1,

ASE(hM ASE )

(1.24)

en probabilidad, y que

hM ASE

1,

(1.25)

en probabilidad.
Por tanto, los mtodos de seleccin del ancho de banda construidos mediante
un factor de correccin proporcionan anchos de banda asintticamente ptimos.
El problema de determinacin del ancho de banda est resuelto, ya que basta
elegir un valor de h que haga mnimo alguno de los selectores anteriores.
Parece razonable preguntarse en esta situacin por las razones de convergencia de (1.24) y (1.25). El siguiente teorema responde a esta cuestin.

Teorema 1.2 Bajo las hiptesis anteriores se tiene que


2

n3/10 (h hM ASE ) N (0, 1 ),

n ASE(h) ASE(hM ASE ) C1 X1 ,

2
en distribuciones, donde 1 y C1 estn denidas en (1.25)

Una consecuencia inmediata de este teorema es que la razn relativa de



convergencia entre h y hM ASE es muy lenta e igual a n1/10 . Adems,

ASE(h) ASE(hM ASE )


,

ASE(hM ASE )
decrece a una razn de n1/5 .
A la vista de este resultado, puede pensarse que las velocidades alcanzadas
son insatisfactorias. Sin embargo el siguiente teorema establece idnticas razones

para las diferencias hM ASE - hM ASE y ASE(hM ASE ) - ASE(hM ASE ).

Teorema 1.3 Bajo las mismas hiptesis del teorema anterior, se cumple que
2

n3/10 (hM ASE hM ASE ) N (0, 2 ,

y
2

n ASE(hM ASE ) ASE(hM ASE ) C2 X1 ,


2
en distribucin, donde 2 y C2 estn denidas en (1.26)

14

1.3. ESTIMADOR ADAPTADO A LAS DISCONTINUIDADES.

Una ventaja de los mtodos de seleccin del ancho de banda construidos


mediante un factor de correccin (incluidos CV y GCV) es que resuelve el problema de denicin que existen en los puntos en los que m 0, adaptndose de
forma automtica a este caso.
Una consecuencia importante de los teoremas (1.2) y (1.3) es que implican
que el mtodo plug-in de seleccin del ancho de banda, incluso en el caso de que
2 y (m )2 son conocidos, tiene una razn de convergencia no mayor que la
de un ancho de banda obtenido por los mtodos propuestos anteriormente, lo
que puede poner en cuestin el uso de estos mtodos.
Sin embargo, y dado que estos resultados son asintticos existen ocasiones
en las que los mtodos plug-in proporcionan mejores resultados que las de otro
mtodo de seleccin automtica.
Las constantes 1 , 2 C1 y C2 vienen dadas por:
2
2
2
1 = 4 /C3 ,

(1.26)

2
2
2
2 = 3 /C3 ,

(1.27)

2
C1 = C3 1 /2,
2
C2 = C3 2 /2,

2
4 =

8 4
3
C0

w2

2
(K L)2 + 4C0 2 d2
k

(m )2 w2 ,

L(u) = uK (u),
3
4

8
3
C0

w2

+ 4C0 2 d2
k
C3 =

2 2 2
3 ck
C0

(K K K L)2 +
(m )2 w2 ,
2
w + 3C0 d2 (m )2 w2 ,
k

donde denota convolucin.

1.3. Estimador adaptado a las discontinuidades.


La mayora de los mtodos tradicionales de regresin no paramtricos trabajan bajo la hiptesis de suavidad, esto produce unas estimaciones suaves de
las funciones de regresin, pero tienden a mostrar su tendencia si est presenta
cualquier discontinuidad.

1.3. ESTIMADOR ADAPTADO A LAS DISCONTINUIDADES.

15

Existen muchos problemas basado en datos reales que implican que hay
funciones de regresin suaves que tienen saltos en un nmero nito de puntos,
tales, como el impacto de un terremoto, un cambio climtico repentino, etc..
Para tratar el problema de estimar la funcin de discontinuidad y sus puntos
de salto en regresin se propone un mtodo que consiste en dos pasos:
En la primera etapa se estimaran los puntos de saltos.
Y en la segunda etapa se estimara la funcin de regresin a travs de
una versin adaptada del estimador lineal local suave, que hace uso de los
saltos ya estimados.
Consideramos un modelo de regresin del tipo (1.1)
La funcin de regresin m es suave en todas partes y tiene un nmero nito de
puntos de salto conocidos q , los cules podemos escribir como tk (k = 1..., q). Qiu
(2002), Horvth y Kokoszka (2002) y otros propusieron mtodos para determinar
el nmero puntos de salto .
Consideramos una descomposicin de m dada por m(x) = (x) + (x),
siendo (x) una funcin en [0, 1], y (x) una funcin de salto denida por
(x) = q (tk )1[tk ,1] , para x [0, 1], donde (tk ) denota el tamao de salto
k=1
en el punto tk (k = 1..., q).
Se propone un mtodo para estimar la funcin discontinua de regresin junto
con sus puntos de salto. Para estimar los puntos de salto se emplea el estimador
local lineal suave (Ruppert y Wand (1994), y Fan y Gijbels (1996) entre otros),
junto con el mtodo de observaciones proyectadas pero extendido a un diseo
aleatorio (Wu y Chu (1993b, c)). Notamos los puntos de salto estimados por

tk (k = 1, ..., q), deniendo t0 = 0 y tq+1 = 1, y se considera tk1 tk para


k = 1, ..., q + 1.
El mtodo de observacin proyectado se utiliza para agregar nuevas observaciones en las proximidades de los puntos de discontinuidad. As, estas observaciones permiten contrarrestar el sesgo excesivo de la estimacin ncleo no slo
en la regin frontera como Wu y Chu(1993b, c), sino tambin el sesgo causado
por los puntos de salto. Gijbels y otros. (2004) establecieron analogas entre la
naturaleza de los efectos del lmite y la presencia de discontinuidades en la funcin de regresin. Debido a las buenas propiedades del estimador local lineal en
la regin frontera, nos centramos en estos mtodos de observaciones proyectadas
para conseguir ms observaciones localizadas a la izquierda y derecho de cada

intervalo [tk1 , tk ].
El mtodo ms empleado para estimar puntos de salto consiste en las estimaciones de regresin no paramtrica obtenida restando estimaciones unilaterales a
cada lado de un punto dado de la estimacin. Mller (1992), Wu y Chu (1993c),
y Mller y Song (1997) entre otros han propuesto tales procedimientos, pero
consideran estimaciones de la regresin ncleo denidas en un diseo jo. Loader (1996) y ms tarde Horvth y Kokoszka (2002) introdujeron los mtodos
basados en la estimacin polinmica local unilateral de la regresin segn diseos jos con los puntos equidistantes. Grgoire y Hamrouni (2002) estimaron
un solo punto de salto para una funcin de regresin discontinua usando un

16

1.3. ESTIMADOR ADAPTADO A LAS DISCONTINUIDADES.

estimador ncleo lineal. Hall y Titteringtron (1992) propusieron un algoritmo


basado en el de McDonald y Owen (1986) para estimar la funcin de regresin
discontinua bajo diseo jo.
El procedimiento que describimos es ms simple que los mencionados hasta la
fecha: no requiere ningn algoritmo iterativo y evita as problemas de seleccin
de ancho de banda en cada paso. El problema de la regresin se formula para un
diseo aleatorio y el mtodo es vlido para estimar ms de un punto de salto as
como la funcin de regresin discontinua asociada. Por otra parte, se basa en el
estimador ncleo local conocido por sus buenas propiedades tericas y prcticas.

1.3.1. Estimador propuesto.


El procedimiento consiste en dos etapas:
1a Etapa: Estimar los puntos del salto.
2a Etapa: Construir un estimador de la funcin de regresin discontinua
empleando los puntos de salto previamente estimados.
Para estimar los puntos de salto consideramos el siguiente estimador:

mh (x) =

{i:xi [1,2]}

P
Kh (x xi ) {sn,2 (x xi )sn,1 } yi

{i:xi [1,2]} sn,2 sn,0

(sn,1 )2

(1.28)

donde K es la funcin ncleo y las funciones sn,j estn dadas por

Kh (x xi )(x xj )j .

sn,j =
{i:xi [1,2]}

Los valores xi son los pseudo-puntos construidos a partir de los puntos del diseo
(Wu y Chu (1993b, c) de la forma siguiente:

xi = (1)x1i

i = 2 n, 2 n + 1, ..., 0,

Estos pseudo-puntos sern las localizaciones de las observaciones proyectadas


en el primer intervalo. De igual forma,

xi = 2 x2ni+1

i = n + 1, n + 2, ..., 2n 1,

son los pseudo-puntos en la segunda regin proyectada. Finalmente se obtiene,

i = 2 n, 2 n + 1, ..., 0,
y2i + 2mgL (0)(xi ),
P
yi ,
i = 1, 2, ..., n,
yi =

y2ni + 2mgR (1)(xi 1), i = n + 1, n + 2, ..., 2n 1,

donde mgL y mgR son funciones ncleos suaves (Wu y Chu (1993c)). L y R

estn dadas por L(x) = (6 12x) y R(x) = (1)L(x), y g = 1,572h es un


ancho de banda piloto comn.

17

1.3. ESTIMADOR ADAPTADO A LAS DISCONTINUIDADES.

Consideramos la funcin diferencia D() = m1 ()m2 (), donde m1 () y m2 ()

son estimadores del tipo (1.28) con igual ancho de banda, pero con funciones
ncleo K1 y K2 diferentes.

El ancho de banda comn h es seleccionado generalmente por el procedimiento de validacin cruzada.


Finalmente los puntos del salto son estimados por:

tk = max|D(x)| k = 1, ..., q,
x Ak

donde Ak est dado por


k1

[tj , tj + ], k = 1, ..., q,

Ak = [h, 1 h]
j=1

siendo h el ancho de banda seleccionado por validacin cruzada y una


constante cercana a cero.
Para estimar la funcin de regresin discontinua se considera la siguiente
modicacin de las observaciones proyectadas
pk
yi = y2i + 2mgL (x)(xi t ),

i = 2 n, 2 n + 1, ..., 0,
k
pk
k1 ), i = n + 1, n + 2, ..., 2n 1,
yi = y2ni + 2mgR (x)(xi t

(1.29)

pk
donde yi = yi para i = 1, ..., n. Los pseudo-puntos, el ancho de banda g y
la funcin ncleo mgR y mgL son elegidos bajo idnticas consideraciones.

Finalmente, para cada k = 1, ..., p + 1 y x [tk1 , tk ] se propone el estimador


de la funcin de regresin dada por
q+1

mh (x) =

k=1


{i:xi [2tk1 tk ,2tk tk1 ]}

p
Kh (x xi ){sn,2 (x xi )sn,1 }yi k
,
sn,2 sn,0 (sn,1 )2

pk
donde yi son los datos proyectados obtenidos de las observaciones originales

yi y los puntos de diseo xi [tk1 , tk ]. Los sn,j estn dados por

Kh (x xi )(x xi )j .

sn,j =


{i:xi [2tk1 tk ,2tk tk1 ]}

Para la seleccin del ancho de banda consideramos la funcin de validacin


cruzada, es decir
p+1

CV (h) = n1

(yj mh,j (xj ))2 ,

k=1 {j:xj [tk1 ,tk ]}


donde para cada xj [tk1 , tk ] mh,j es el estimador de mh (xj ) donde se ha

omitido la observacin (xi , yj ). El ancho de banda que hace mnima esta funcin

se denota por hCV .

Captulo 2

El estimador de Breidt y
Opsomer (2000).
En muchos estudios de muestreo en poblaciones nitas es fcil obtener informacin auxiliar de la poblacin, que puede ser utilizada para mejorar la precisin
de los estimadores. La estimacin modelo-asistida proporciona un marco para
incorporar modelos de superpoblacin en la estimacin basada en el diseo.
En el contexto del muestreo en poblaciones nitas, Breidt y Opsomer (2000)
presentaron el estimador de regresin polinmico local adaptado al diseo. Bajo
hiptesis de suavidad sobre m(x) obtuvieron un estimador asintticamente insesgado y consistente para la media. Varios estudios de simulacin indican que
este estimador es ms eciente que el estimador de regresin cuando el modelo
no est correctamente especicado, mientras que si el modelo est correctamente especicado entonces ambos estimadores son aproximadamente igual de
efectivos.
Este estimador mejora la eciencia del diseo de los estimadores de regresin en el caso donde es difcil ver a priori la relacin existente entre la variable
de inters y la variable auxiliar. Como en cualquier mtodo de regresin no
paramtrico las caractersticas prcticas del estimador dependen de la eleccin
del parmetro de suavizado (ancho de banda). Breidt y Opsomer (2000) utilizaron un ancho de banda jo, sin embargo no estudiaron cmo seleccionar el
mejor valor de ste. Opsomer y Miller (2005) propusieron un mtodo para seleccionar el mejor ancho de banda minimizando un cierto criterio de validacin
cruzada.

2.0.2. El estimador modelo-asistido de Breidt y Opsomer


(2000).
Consideramos una poblacin nita U = {1, ..., i, ..., N }. Para cada i U se
observa una variable auxiliar xi .
Sea tx = i U xi . Se selecciona una muestra s de la poblacin U de acuerdo
18

19

CAPTULO 2. EL ESTIMADOR DE BREIDT Y OPSOMER (2000).

con un diseo muestral de tamao jo, donde p(s) es la probabilidad de extraer


dicha muestra. Sea n el tamao de la muestra. Notamos que i = P r{i s} =
U . Para
s:i s p(s) > 0 y ij = P r{i, j s} =
s:i,j s p(s) > 0 para todo i, j
cada i s se observa una variable estudio yi . El objetivo es estimar ty = i U yi .
Sea Ii una variable indicadora, tal que, Ii = 1 si i s y Ii = 0 en otro
caso. Ntese que Ep [Ii ] = i , en donde Ep [] denota un promedio sobre todas
las muestras posibles de la poblacin en estudio. Un estimador bien conocido de
ty es el estimador de HorvitzThompson,

ty =
i s

yi
=
i

i U

yi Ii
.
i

(2.1)

La varianza del estimador de HorvitzThompson est dada por

V arp (ty ) =

(ij i j )
i,j U

yi yj
.
i j

(2.2)

La eciencia del estimador Horvitz-Thompson se puede mejorar utilizando informacin auxiliar.


Consideremos el siguiente modelo de superpoblacin

yi = m(xi ) + i ,
donde i son variables aleatorias independientes de media cero y varianza
v(xi ), m(x) es una funcin suave de x, y v(x) es tambin suave y estrictamente
positiva. Dada xi , m(xi ) = E[yi ] es la funcin de regresin mientras que V ar(yi )
es la funcin varianza.
Sea K una funcin ncleo continua y h el ancho de banda. Presentamos el
estimador polinmico local tipo ncleo de grado p basado en los datos poblacionales. Sea yU = [yi ]i UN el vector de dimensin N de yi en la poblacin nita.
Denimos la matriz N (p + 1)

1 x1 xi . . . (x1 xi )p

.
.
.
p
.
.
.
XU i = .
.
= [1 xj xi . . . (xj xi ) ]j U ,
.
.
.
.

xN xi

...

(xN xi )p

y denimos la matriz,

WU i = diag

1
K
h

xj xi
h

.
j U

Sea er el vector con un 1 en la posicin rsima y ceros en el resto. El estimador polinmico local de la funcin de regresin en xi basado en la poblacin,
viene dado por

mi = e1 (XU i WU i XU i )1 XU i WU i yU = wU i yU ,
que estar bien denido si XU i WU i XU i es inversible.

(2.3)

20

CAPTULO 2. EL ESTIMADOR DE BREIDT Y OPSOMER (2000).

Si los mi son conocidos entonces un estimador insesgado de ty basado en el


diseo sera el estimador de diferencia generalizada

t =
y
i s

yi mi
+
i

(2.4)

mi ,
i U

y su varianza sera

V arp (t ) =
y

(ij i j )
i,j U

yi mi yj mj
.
i
j

(2.5)

El estimador poblacional mi es el estimador tradicional de regresin polinmico local para la funcin desconocida m(). Sin embargo, no puede ser calculado
porque slo conocemos los yi de s U . Sea ys = [yi ]i s el vector de dimensin
n de yi obtenido de la muestra. Denimos la matriz de dimensin n (p + 1)

Xsi = [1 xj xi
y sea

Wsi = diag

(xj xi )p ]j s ,

...

1
K
i h

xj xi
h

.
j s

Un estimador muestral de mi basado en el diseo viene dado por


o
mo = e1 (Xsi Wsi Xsi )1 Xsi Wsi ys = wsi ys ,
i

(2.6)

que est denido si Xsi Wsi Xsi es inversible. Si sustituimos los mo en (2.4)
i
obtenemos el estimador de regresin polinmico local para el total poblacional

y
to =
i s

yi mo
i
+
i

mo .
i

(2.7)

i U

El estimador muestral (vese (2.6)) diere signicativamente del estimador de


regresin polinmico local tradicional. La presencia de las probabilidades de inclusin en los wo hacen que el estimador mi , basado en la muestra, sea un

si
estimador consistente bajo el diseo, con un ancho de banda h jo y no necesariamente ptimo. Independientemente de la eleccin del ancho de banda, mi
es un parmetro bien denido para una poblacin nita. En principio, el estimador (2.6) puede no estar denido para cierto i U : si para alguna muestra s
hay menos de p + 1 observaciones en el dominio de denicin del ncleo para
un xi entonces la matriz Xsi Wsi Xsi sera singular. Esto no es un problema en
la prctica, ya que se puede seleccionar un ancho de banda lo sucientemente
grande para que Xsi Wsi Xsi sea inversible para todos los xi . Sin embargo, esta
situacin no puede ser excluida tericamente mientras el ancho de banda se considere jo para una determinada poblacin. A continuacin vamos a considerar
un estimador muestral que existe para cualquier muestra s U .
El ajuste del estimador muestral para mi viene dado por

mi = e1

Xsi Wsi Xsi + diag

N2

p+1
j=1

Xsi Wsi ys = wsi ys ,

(2.8)

21

CAPTULO 2. EL ESTIMADOR DE BREIDT Y OPSOMER (2000).

para > 0. Los trminos N 2 en el denominador garantizan que el estimador


est bien denido para todo s U . Otro posible ajuste consistira en reemplazar
la eleccin habitual del ncleo (como puede ser un ncleo gaussiano). En la
prctica esta eleccin slo aumenta la complejidad computacional del estimador
lineal. Finalmente el estimador de regresin polinmico local para (2.8) est
dado por

ty =
i s

yi mi

+
i

mi .

(2.9)

i U

Este estimador presenta propiedades tericas atractivas que procedemos a


estudiar, se hacen los siguientes supuestos:
1. (Distribucin de los errores bajo el modelo de superpoblacin). Los errores
i son variables aleatorias independientes de media 0, varianza v(xi ) y
dominio de denicin compacto, uniformemente N
2. Para cada N , los xi se consideran jos con respecto al modelo de superpoblacin. Los xi son independientes e idnticamente distribuidos F (x) =
x
f (t)dt , donde f () es una funcin de densidad en el intervalo [ax , bx ]

y f (x) > 0 para todo x [ax , bx ]


3. (Funcin media y varianza sobre un intervalo [ax , bx ]). La funcin de regresin m() es continua y tiene p + 1 derivadas continuas, y su varianza
v(x) es tambin una funcin continua y estrictamente positiva.
4. (Ncleo K). El ncleo K() es compacto en [1, 1], simtrico y continuo,
y cumple:
1
1

K(u)du = 1.

5. (La razn muestral n/N y ancho de banda h). Si N , n/N (0, 1),
h 0, y N h2 /(log log N ) .
6. (Probabilidades de inclusin i y ij ).
Para todo N , m i
n

i > 0, m i,j
n

lim sup n
N

ij > 0

max |ij i j | < .

i,j U :i=j

7. Supuestos adicionales relacionados con las probabilidades de inclusin de


orden superior.

lim n2

max

N (i1 ,i2 ,i3 ,i4 ) D4,N

|Ep [(Ii1 i1 )(Ii2 i2 )(Ii3 i3 )(Ii4 i4 )]| < ,

donde Dt,N denota la pareja de todos los distintos (i1 , i2 , ...., it ) para U ,

22

2.1. PROPIEDADES TERICAS DEL ESTIMADOR DE BREIDT Y OPSOMER(2000).

max

lim

Ep [(Ii1 Ii2 i1 i2 )(Ii3 Ii4 i3 i4 )] = 0,

max

Ep [(Ii1 i1 )2 (Ii2 i2 )(Ii3 i3 )] < .

N (i1 ,i2 ,i3 ,i4 ) D4,N

lim sup n
N

(i1 ,i2 ,i3 ) D3,N

2.1. Propiedades tericas del estimador de Breidt


y Opsomer(2000).
2.1.1. Peso y calibracin.
Observamos para (2.7) que

y
to

=
i s

=
i s

yi
+
i
j U

1
+
i

j U

Ij
j

Ij
1
j

wo ys
sj

wo ei yi
sj

(2.10)

wis yi .
i s

y
Por lo tanto to es una combinacin lineal de los yi s muestrales, donde los
pesos son las probabilidades inversas de inclusin, modicadas convenientemente
para reejar la informacin en la variable auxiliar xi . El mismo razonamiento

se aplica directamente a ty .
Debido a que los pesos son independientes de yi , se pueden aplicar a cualquier
variable de estudio de inters. En particular, se pueden aplicar a las variables
1, xi , ..., xp . A continuacin, es sencillo comprobar que para el estimador de
i
y
regresin polinmico local to se verica
wis xl =
i
i s

xl ,
i
i U

para l = 0, 1, ..., p.

2.1.2. Diseo asintticamente insesgado y consistente.


El precio por el empleo de mi en lugar de mi en el estimador de diferencia

generalizada (2.4) es el sesgo bajo el diseo. Sin embargo, el estimador ty es


asintticamente insesgado y consistente bajo el diseo, y esto lo demostraremos
con el teorema siguiente.

23

2.1. PROPIEDADES TERICAS DEL ESTIMADOR DE BREIDT Y OPSOMER(2000).

Teorema 2.1 Suponemos 1-7. Entonces el estimador de regresin polinmico

local

ty =

(yi mi )

i U

Ii
+ mi

es asintticamente insesgado bajo el diseo en el sentido que

ty ty
N

lim Ep

=0

con probabilidad 1,

y es consistente bajo el diseo en el sentido que


lim Ep I{|ty ty |>N } = 0

con probabilidad 1

para todo > 0.

Demostracin 2.1. Por la desigualdad de Markov se tiene que:


l Ep
m

ty ty
= 0.
N

Siendo

ty ty
=
N

i U

Ii
1 +
i

yi mi
N

i U

mi mi

Ii
i

Entonces

Ep

ty ty
N

Ep
i U

yi mi
N

+ Ep
i U

Ii
1
i

(mi mi )2

Ep
N

(2.11)

i U

1
(1 i Ii )
N

1/2

Suponiendo 1-6 y usando que

l sup
m
N

1
N

(yi mi )2 < ,
i U

por el Lema 2 (iv)(ver Apndice Breidt and Opsomer(2000)), el primer trmino de la derecha de (2.11) converge a cero como N (ver teorema 1 en
Robinson and Srndal(1983)). Suponiendo 6 entonces,

Ep
i U

1
(1 i Ii )2
N

=
i U

i (1 i )
1
.
2
N i

Combinando esto con el lema 4 (ver Breidt and Opsomer (2000)), el segundo
trmino de la derecha de (2.11) converge a cero como N .

24

2.1. PROPIEDADES TERICAS DEL ESTIMADOR DE BREIDT Y OPSOMER(2000).

2.1.3. Error cuadrtico medio asinttico.


En este apartado se obtiene una aproximacin asinttica del error cuadrtico
medio del estimador modelo-asistido y se propone un estimador consistente de la
varianza. En primer lugar se demuestra que el error cuadrtico medio asinttico
del estimador de regresin polinmico local es equivalente a la varianza del
estimador de diferencia generalizado (2.5).

Teorema 2.2 Suponemos 1-7. Entonces

ty ty
N

nEp

n
=
N2

(yi mi )(yj mj )
i,j U

ij i j
+ o(1).
i j

(2.12)

Demostracin 2.2 Sea


a = n1/2
i U

Ii
1
i

yi mi
N

mi mi

b = n1/2
i U

Ii
1 .
i

Entonces

Ep [a2 ] =

n
N2

(yi mi )(yj mj )
i,j U

n maxi,j
1
+

U : i=j |ij
2

ij i j
i j

i j |
i U

(yi mi )2
, (2.13)
N

de forma que lim supN Ep [a2 ] < por la propiedad 6. Por el lema 5 (Breidt
and Opsomer (2000)), Ep [b2 ] = o(1) por lo que

Ep [ab] (Ep [a2 ]Ep [b2 ])1/2 = o(1).


Por lo tanto,

nEp

ty ty
N

= Ep [a2 ] + 2Ep [ab] + Ep [b2 ] = Ep [a2 ] + o(1),

con lo que el resultado queda probado.


El resultado siguiente demuestra que el error cuadrtico medio asinttico en
(2.13) puede ser estimado de forma consistente.

Teorema 2.3 Suponemos 1-7. Entonces

lim n Ep V N 1 ty AMSE N 1 ty

= 0,

donde
1

V N 1 ty = 2
N

(yi mi )(yj mj )

i,j U

ij i j Ii Ij
i j
ij

(2.14)

2.1. PROPIEDADES TERICAS DEL ESTIMADOR DE BREIDT Y OPSOMER(2000).

AMSE N 1 ty =

1
N2

(yi mi )(yj mj )
i,j U

25

ij i j
.
i j

Por tanto V N 1 ty es un estimador asintticamente insesgado y consistente

bajo el diseo de AMSE N 1 ty .

Demostracin 2.3.

Escribimos lo siguiente:

A = nEp

1
N2

(yi mi )(yj mj )
i,j U

ij i j Ii Ij
.
i j
ij

Ahora

1
n2 Ep 2
N

n2
i,k U

i,j U

2
ij i j Ii Ij ij
(yi mi )(yj mj )
i j
ij

1 i 1 k (yi mi )2 (yk mk )2 ik i k
i
k
N4
i k

+2n2
i U k,l U :k=l

Ep

1 i kl k l (yi mi )2 (yk mk )(yl ml )


i
k l
N4

Ii i Ik Il kl
+ n2
i
kl

i,j U,i=j k,l U :k=l

ij i j kl k l
i j
k l

(yi mi )(yj mj )(yk mk )(yl ml )


Ii Ij ij Ik Il kl
Ep
N4
ij
kl
a1 + a2 + a3 .

=
Pero

a1

n2
k,l U :k=l

(yi mi )4
+ n2
3 N 4

nmaxi,k
1
+
N 3

i,k U :i=k

U :i=k |ik
N 4

(yi mi )2 (yk mk )2 |ik i k |


4 N 4

i k |

el cual tiende a cero cuando N , y

i U

(yi mi )4
,
N

26

2.1. PROPIEDADES TERICAS DEL ESTIMADOR DE BREIDT Y OPSOMER(2000).

a3

(nmaxi,k

U :i=k |ik
4 2

i k |)

i,j U :i=j k,l U :k=l

|(yi mi )(yj mj )(yk mk )(yl ml )|


Ii Ij ij Ik Il kl

Ep
4
N
ij
kl
(nmaxi,k U :i=k |ik i k |)2
O(N 1 ) +
4 2
Ii Ij ij Ik Il kl
(yi mi )4
Ep
,
max
i
kl
N
(i,j,k,l) D4
i U

que converge a cero cuando N por la propiedad 7. Para demostrar que


a2N 0 cuando N se puede aplicar la desigualdad de Cauchy-Schwarz,
y entonces AN 0 cuando N .
Entonces, escribimos:

=
+

nEp

1
N2

{2(yi mi )(mj mj )

i,j U

ij i j Ii Ij
i j
ij
2n
U :i=j |ij i j |
+ 2
2
N

(mi mi )(mj mj )}

2nmaxi,j

Ep [(mi mi )2 ]

N
N
nmaxi,j U :i=j |ij i j |
n
+ 2
2

N
Ep [(mi mi )2 ]

i U
N
i U (yi

mi )2

1/2

i U

cuando N usando 6 y el lema 4. El resultado es el siguiente:

nEp V (N 1 ty ) AMSE(N 1 ty ) A + B.

2.1.4. Normalidad asinttica.


El estimador de regresin polinmico local hereda las caractersticas limitadoras de la distribucin del estimador generalizado de diferencia, como ahora
demostramos.

Teorema 2.4 Suponemos que 1-7 se verican, y sean t y V arp (t ) denidos


y
y
en (2.4) y (2.5), respectivamente. Entonces
N 1 (t ty )
y
V

1/2
arp

N 1 t
y

N(0, 1)

2.1. PROPIEDADES TERICAS DEL ESTIMADOR DE BREIDT Y OPSOMER(2000).

27

cuando N , esto implica que

N 1 (ty ty ) L
N(0, 1)
1/2 N 1 ty

cuando N , donde V (N 1 ty ) est dado en (2.14).

Demostracin 2.4 De la demostracin del Teorema 2.2,

N 1 (ty ty ) =
i U

Ii
1 +op (n1/2 ) = N 1 (t ty )+op n1/2 .
y
i

yi mi
N

Adems, V (N 1 ty )/AM SE(N 1 ty ) p 1 por el Teorema 2.3, con lo que se


prueba el resultado.

2.1.5. Robustez.
En este apartado se considera

V ar(N 1 (ty ty )) = E N 1 (t ty )

E 2 [N 1 (ty ty )].

Se puede demostrar que

E 2 [N 1 (ty ty )] = o(n1 ).

Godambe y Joshi (1965) demostraron que para cualquier estimador ty se


satisface

E 2 [N 1 (ty ty )] = 0,
por lo que se tiene la siguiente desigualdad

ty ty
N

1
N2

v(xi )
i U

1 i
.
i

La parte derecha de la expresin anterior es el lmite inferior de GodambeJoshi , que alcanza su mnimo valor cuando i v 1/2 (xi ). Hay condiciones

bajo las cuales el estimador de regresin generalizada asinttico alcanza este


lmite inferior. Por consiguiente queda demostrado que el estimador modeloasistido de Breidt y Opsomer (2000) es robusto en el sentido de que alcanza el
lmite inferior de Godambe-Joshi asintticamente.

Teorema 2.5 Bajo las propiedades 1-7, ty alcanza asintticamente el lmite

ms bajo de Godambe-Joshi, en el sentido de que:


nE

ty ty
N

n
N2

v(xi )
i U

1 i
+ o(1).
i

28

2.2. SELECCIN DEL ANCHO DE BANDA.

Demostracin 2.5 Escribimos:


n1/2
N

b=

n1/2
N

c=

d=

n1/2
N

Ii
1 ,
i

(mi mi )

i U

(yi m(xi ))

Ii
1 ,
i

(m(xi ) mi )

Ii
1 .
i

i U

i U

Entonces:

nE

ty ty
N

E[b2 ] + E[c2 ] + E[d2 ] + 2E[bc]


2E[bd] + 2E[cd].

Por el Lema 8, E[b2 ] 0 cuando N . Luego,

E[d2 ]

n
N2

i,j U

nmaxi,j

E [(mi m(xi ))(mj m(xj ))]


U :i=j |ij
2

i j |

ij i j
i j

E(mi m(xi ))2


N
U

cuando N por el Lema 6 de Breidt y Opsomer (2000). Denotamos que:

E[c2 ] =

n
N2

v(xi )
i U

as que

lim supE[c2 ] lim sup


N

1
N

1 i
i

v(xi ) <
i U

por la propiedad 3.

2.2. Seleccin del ancho de banda.


Al igual que ocurre con los mtodos de regresin no paramtrica, el rendimiento del estimador depende de la seleccin del parmetro de suavizado (ancho de
banda). Breidt y Opsomer (2000) utilizan un ancho de banda jo, mientras que
Opsomer y Miller (2005) presentaron un selector de ancho de banda ptimo
adaptado al diseo.
Hay muchas formas de seleccionar un valor apropiado para el ancho de banda.
El criterio para la seleccin ptima del ancho de banda, en el contexto del
muestreo en poblaciones nitas, es el error cuadrtico medio (MSE), basado en

29

2.2. SELECCIN DEL ANCHO DE BANDA.

el diseo del estimador, esta cantidad mide las desviaciones de las medidas entre
un estimador basado en la muestra y un parmetro poblacional.
Segn han demostrado Breidt and Opsomer(2000), V arp (t ) (2.5) es una
y

aproximacin asinttica de M SEp (ty ) y del M SE de ty , y ambos son estimados


por:


V (ty ) =
i,j

ij i j yi mi yj mj

.
ij
i
j
s

(2.15)

En la estimacin modelo-asistido del total poblacional el sesgo bajo el diseo


es asintticamente insignicante en comparacin con la varianza bajo el diseo,

de forma que el estimador (2.15) estima el trmino principal de M SEp (ty ). Las
2
condiciones sucientes para que se cumplan esto son que h 0 y nh .

Esto se puede explicar por el hecho de que el trmino principal de M SEp (ty )
depende solamente de las residuos yi mi , mientras que el M SE del estimador
de regresin no paramtrico basado en el modelo depende de las desviaciones
mi m(xi ) (que estn sujetos al sesgo y varianza de la estimacin).

El estimador (2.9) depende del valor elegido para el ancho de banda h.


El objetivo que se pretende es seleccionar un ancho de banda que minimice

M SEp (ty ).

Sea hopt el ancho de banda ptimo desconocido. Como V (ty ) es un estimador

consistente de M SEp (ty ) podramos pensar en estimar hopt por el valor del

ancho de banda que hace mnimo V (ty ). Pero ste no es un estimador vlido en
la prctica puesto que si h 0 entonces mi est prximo a yi , y si h es pequeo

mi puede no existir.


Por tanto, V (ty ) se puede hacer arbitrariamente pequea cuando h se acerca

a 0. Por otra parte, M SEp (ty ) sigue siendo en general ms grande de 0 para
todos los valores de h. Por consiguiente el ancho de banda que hace mnimo a

V (ty ) es una buena opcin para estimar hopt .

Sin embargo podemos modicar V (ty ) de modo que proporcione un criterio ms conveniente para la seleccin del ancho de banda. Se reemplaza cada
()
estimador mi en la ecuacin (2.15) por un estimador mi . Para hacer esto

substituimos wsi en la ecuacin (2.6) por un vector wsi modicado en la forma


wsij
1wsii si j = i
wsij =
(2.16)

0
si i = j,
()

donde wsij es el jsimo elemento del vector wsi , y mi = i s wsij yi .

Intuitivamente, esto evita el problema descrito anteriormente para mi , puesto

()
que utilizamos solamente {yi : j = i s} para estimar mi de modo que h 0,

()
esto hace automticamente que mi no se aproxime a yi . Opsomer y Miller


(1995) propusieron la modicacin de la V (ty ) empleando un criterio de seleccin
del ancho de banda dado por

30

2.3. ESTUDIO DE SIMULACIN.

()

VCV (h) =
i,j

ij i j yi mi
ij
i
s

()

yj mj

(2.17)

VCV (h) es el llamado criterio de seleccin del ancho de banda por validacin

cruzada basado en el diseo. Notamos hCV a la estimacin de hopt que hace


CV (h).
mnimo a V

2.3. Estudio de simulacin.


En esta seccin resumimos el estudio de simulacin donde se comparan los
rendimientos de los siguientes estimadores:
HT
Horvit-Thompson
REG
Regresin lineal(Cochran[(1977) pgina 193])
REG3
Regresin Cbica
PS
Post-estraticacin(Cochran[(1977) pgina 134] )
LPR0
Polinomial local con p = 0
LPR1
Polinomial local con p = 1
KERN
Basado en el modelo no paramtrico(Dorfman(1992))
CDW Sesgo-calibracin no paramtrico(Chambers, Dorfman y Wehrly(1993))
Los cuatro primeros estimadores son paramtricos mientras que los cuatros
siguientes son no paramtricos. El estimador de post-estraticacin est dividido
en diez estratos de igual tamao.
De los procedimientos no paramtricos dos son modelos asistidos (LPR0 y
LPR1) y dos basados en el modelo (KERN y CDW). En KERN la estimacin de
la funcin media se utiliza para predecir cada yi no muestral. El estimador CDW
implica realizar un paso de calibracin adicional, que requiere la especicacin
de un modelo paramtrico. Se considera el modelo m(x) = x, v(x) = 2 . En
KERN y CDW se utiliza el estimador de Nadaraya-Watson, que es tambin
utilizado por LPR0 para un muestreo de probabilidades iguales.
Para todos los estimadores no paramtricos se utiliza la funcin ncleo de
Epanechinkov;

3
(1 t2 )2 I{|t|1} ,
4
Se consideran dos anchos de banda diferentes: h = 0,1 y h = 0,25 y ocho
funciones de regresin:
K(t) =

31

2.3. ESTUDIO DE SIMULACIN.

Lineal
Cuadrtica
Bump
Salto
cdf
Exponencial
Ciclo 1
Ciclo 4

m1 (x) = 1 + 2(x 0,5),


m2 (x) = 1 + 2(x 0,5)2 ,
m3 (x) = 1 + 2(x 0,5) + exp(200(x 0,5)2 ),
m4 (x) = 1 + 2(x 0,5)I{x0,65} + 0,65I{x>0,65}
m5 (x) = 1,52x , donde es la normal estandar cdf,

m6 (x) = exp(8x),
m7 (x) = 2 + sin(2x),
m8 (x) = 2 + sin(8x),
(2.18)

con x [0, 1].


Para m1 se espera que REG sea el mejor estimador ya que asumimos que
el modelo esta correctamente especicado. Por lo tanto, es interesante ver si
hay o no eciencia, cunta, y si se pierde al asumir que el modelo es suave
en vez de lineal. La funcin m2 tiene tendencia cuadrtica pero si asumimos
que es un modelo lineal podra no estar especicado sobre todo el rango de xk ,
aunque podra ser razonable localmente. La funcin m3 es lineal sobre la mayor
parte de su rango excepto para la poblacin Bump, presente para una pequea
proporcin del rango de xk . m4 es una funcin discontinua, m5 la media de una
variable aleatoria binaria, m6 una curva exponencial, y m7 es una funcin seno
que concluye un ciclo completo en [0, 1] mientras que m8 concluye cuatro ciclos
completos.
Los xk poblacionales se generan como variables aleatorias independientes e
idnticamente distribuidas de una uniforme (0, 1), y los valores poblacionales
yik (i = 1, . . . , 8) se generan a partir de las funciones de regresin, agregando
errores i.i.d. de una N (0, ) en todos los casos excepto para la funcin cdf. La
poblacin cdf se genera a partir de:

y5k = I{y1k 1,5} .


Se consideran dos posibles valores para la desviacin tpica de los errores:
= 0,1 y = 0,4. El tamao de la poblacin es N = 1000 tomndose muestras
de tamao n = 100 mediante muestreo aleatorio simple.
Se realizaron 1000 replicas y se calcularon los respectivos estimadores.
La tabla 1 muestra el error cuadrtico medio de todos los estimadores presentados anteriormente MSEs, y el error cuadrtico medio MSE para el estimador
de regresin polinmico local con p = 1 (LPR1). Aunque el modelo este especicado correctamente o no, en general, los estimadores de regresin paramtrica
y no paramtrica son mejores que HT.
En este estudio, los estimadores no paramtricos basados en el modelo KERN
y CDW tienen comportamiento similares, con algunas excepciones. Los estimadores de modelos-asistidos LPR0 y LPR1 son en ocasiones mejores, pero
nunca son mucho peores que los estimadores basados en el modelo. De igual forma LPR1 es mucho mejor en alguno de los casos, pero nunca peor que LPR0.
Por tanto, LPR1 es el mejor estimador no paramtrico.

32

2.3. ESTUDIO DE SIMULACIN.

Los estimadores paramtricos REG3 y PS funcionan mejor que REG, excepto en la poblacin lineal. Tambin podemos observar que en la mayora de los
casos, LPR1 es competitivo o mejor que los estimadores paramtricos (Razn
de MSE 0.95). En varios casos los estimadores paramtricos son algo mejor
que LPR1 (Razn de MSE 0.90-0.94), esto es debido al suavisamiento cuando la
poblacin es lineal o cuadrtica y tambin es debido al excedente de alisado en
otros casos. Finalmente, el estimador PS en las poblaciones Bump y Ciclo 4, as
como REG3 en Ciclo 1 son substancialmente mejores que el estimador LPR1.
Sin embargo, podemos observar que cuando el ancho de banda es muy pequeo el
estimador LPR1 es mucho mejor que el estimador paramtrico correspondiente.
Cuadro 2.1: Razn de MSE de los estimadores de HorvitzThompson(HT), regresin lineal(REG), Regresin Cbica (REG3), post-estraticacin (PS), Regresin Lineal constante (LPR0), Ncleo del modelo basado(KERN), sesgo calibrado no paramtrico(CDW), y regresin lineal local(LPR1)
Poblacin
Lineal

Cuadrtica

Bump

Salto

cdf

Exponencial

Ciclo 1

Ciclo 2

HT

REG

REG3

PS

LPR0

KERN

CDW

0.1
0.1
0.4
0.4
0.1
0.1
0.4
0.4
0.1
0.1
0.4
0.4
0.1
0.1
0.4
0.4
0.1
0.1
0.4
0.4
0.1
0.1
0.4
0.4
1.0
0.1
0.4
0.4
0.1
0.1
0.4
0.4

0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25
0.10
0.25

33.35
35.41
2.97
3.16
2.96
3.08
1.01
1.07
25.06
8.57
3.43
2.94
7.12
4.88
1.47
1.51
6.37
5.00
1.58
1.64
5.21
4.88
1.14
1.20
46.58
16.15
3.91
3.67
3.85
0.98
2.27
0.97

0.09
0.95
0.90
0.95
3.02
3.14
1.02
1.08
4.90
1.67
1.35
1.16
5.24
3.59
1.30
1.33
3.00
2.35
1.05
1.09
2.90
2.72
1.02
1.07
18.68
6.48
2.08
1.95
3.79
0.96
2.26
0.97

0.94
1.00
0.94
1.00
0.94
0.98
0.94
1.00
4.00
1.37
1.30
1.11
2.08
1.42
1.05
1.07
1.64
1.29
0.97
0.01
1.07
1.00
0.96
1.00
1.36
0.47
0.99
0.93
3.56
0.91
2.17
0.93

1.43
1.52
1.05
1.12
1.15
1.20
1.03
1.10
2.08
0.71
1.15
0.98
1.51
1.03
1.07
1.09
1.20
0.94
1.05
1.08
1.36
1.27
1.05
1.10
2.73
0.94
1.15
1.08
1.83
0.46
1.35
0.58

0.98
1.45
0.96
1.00
0.99
1.29
0.96
1.00
1.13
1.13
0.98
1.01
1.00
1.13
0.96
1.00
1.00
1.09
0.98
1.00
1.10
1.64
0.97
1.03
1.24
1.66
0.97
1.09
1.21
1.09
1.07
1.07

0.98
1.68
0.95
1.02
1.02
2.16
0.95
1.07
1.50
1.32
1.01
1.07
1.08
1.53
0.95
1.05
1.02
1.44
0.97
1.04
1.19
2.44
0.96
1.10
1.46
2.55
0.97
1.26
1.97
1.00
1.42
1.01

0.95
0.98
0.95
0.98
1.08
2.70
0.96
1.11
1.47
1.14
1.01
1.03
1.07
1.46
0.95
1.04
1.02
1.58
0.97
1.08
1.19
2.45
0.96
1.10
1.25
2.34
0.96
1.23
2.02
1.09
1.45
1.08

Basado en 1000 rplicas de muestras aleatorias simple para las ocho poblaciones de tamao N = 1000.
Tamao muestral n = 100.
Estimadores no paramtrico calculados con una ancho de banda h y nucleo de Epanechnikov .

Como conclusin nal, el funcionamiento de LPR1 es consistentemente bueno,


en particular cuando el ancho de banda es pequeo, LPR1 pierde una cantidad

2.3. ESTUDIO DE SIMULACIN.

33

pequea de eciencia relativa respecto a REG cuando la poblacin es lineal,


pero domina a REG para otras poblaciones.
Cuando el ancho de banda es grande el estimador de regresin lineal local
es equivalente al estimador de regresin clsico y los M SE tienden a coincidir.
Claramente, el ancho de banda tiene un efecto sobre el MSE de LPR1, sin embargo, dado que este estudio es independientemente de la eleccin del ancho de
banda podemos ver que LPR1 es mejor que HT para todas las poblaciones y
que domina a REG para todas las poblaciones excepto para la lineal. Esto demuestra que, el estimador de regresin lineal local es probablemente una mejora
del estimador de Horvitz-Thompson y del estimador de regresin clsica, cuando
la relacin entre el variable auxiliar y la variable de inters no es lineal.

Captulo 3

Mtodos de regresin no
paramtrica en el muestreo en
poblaciones nitas.
Presentamos a continuacin algunos de los mtodos ms recientes en los
que se ha incorporado la regresin no paramtrica al contexto del muestreo en
poblaciones nitas.

3.1. Estimaciones basadas en el modelo.


Rueda y Snchez-Borrego (2009) presentan un nuevo estimador basada en el
modelo segn la regresin polinomial local. Este estimador cuenta con propiedades
atractivas y se construye sobre modelos de superpoblacin .
En general, se utilizan mtodos paramtricos para representar la relacin
existente entre los datos auxiliares y la variable de estudio, sin embargo, habitualmente la asignacin de tal relacin es inapropiada o no se puede comprobar.
Una alternativa natural propuesta por Kuo (1988) para la funcin de distribucin es adoptar un enfoque no paramtrico del estimador basado en el modelo
que no ponga ninguna restriccin sobre la relacin entre los datos auxiliares y
la variable de estudio. Otros trabajos importantes en este tema son Chambers
et al. (1993), Dorfman (1993), y Dorfman y Hall (1993).
El objetivo en este apartado es utilizar la informacin auxiliar para mejorar
la estimacin mediante un modelo no paramtrico. Para lograr esto adoptamos
un enfoque basado en el modelo, que utiliza el estimador de regresin polinmico local para predecir los valores no muestrales de y . El estimador resultante
presenta buenas propiedades bajo un punto de vista terico y prctico. Para
elegir el ancho de banda vamos a considerar el mtodo de validacin cruzada.
El procedimiento propuesto se dene para un diseo de muestreo general y es
una alternativa vlida a otros estimadores conocidos.

34

35

3.1. ESTIMACIONES BASADAS EN EL MODELO.

3.1.1. Estimador propuesto.


Consideramos una poblacin U = {1, 2, ..., N } de la que se selecciona una
muestra aleatoria s de tamao jo n segn un diseo muestral especicado d y
con probabilidades de inclusin de primer orden i . Sea y la variable objeto de
estudio y x la variable auxiliar los respectivos valores de estas variables para el
isimo elemento de la poblacin son yi y xi . Para estimar la media poblacional
se observan los valores (yi , xi )i s de la muestra s .
Este estimador es insesgado bajo el diseo y no utiliza la informacin auxiliar
x.
Consideremos el siguiente modelo de superpoblacin

yi = m(xi ) + i ,
donde los i son variables aleatorias independientes e idnticamente distribuidas con media cero y varianza constante 2 , m(x) es una funcin suave de
x.
La media estimada se puede escribir como:

y = f ys + (1 f )s ,

y
1
n

1
donde ys =

i s yi y ys = N n
j s yj , el ndice i denota las unidades de

la muestra y j las unidades de s = U s.

Si los valores yj = m(xj ) son conocidos, una estimacin de Y est dada por:

yp = f ys + (1 f )

1
N n

0
yj .

(3.1)

j s

Sin embargo, en la prctica los valores m(xj ) son desconocidos. Para obtener
las estimaciones mj , j s, se emplea la regresin no paramtrica.

Se dene el estimador basado en el modelo para la media poblacional como:

yM B = f ys + (1 f )

1
N n

(3.2)

mj ,

j s

El ancho de banda se selecciona por el mtodo de validacin cruzada (2.17),


donde mj , con j s, es el estimador lineal local tipo ncleo (Fan and Gijbels

(1995)).

3.1.2. Propiedades del estimador.


Destacamos algunas propiedades de dicho estimador.
1. yM B es lineal.

yM B

1
=
N i

yi +
s

1
mj =

N
s

i s

1+

wsj ei
j s

yi =

wis yi ,
i s

36

3.1. ESTIMACIONES BASADAS EN EL MODELO.

siendo wis = 1 +

j s wsj ei

2. yM B no utiliza las probabilidades de inclusin i


1
Los pesos i del estimador de Horvitz-Thompson no incluyen la informacin de la variable auxiliar xi . Estos pesos son reemplazados por unos
nuevos pesos wis que determinan cuntos valores no muestrales se encuentran en el entorno de cada valor muestral y por lo tanto podran conducir
a mejorar la estimacin. Los nuevos pesos ignoran las probabilidades de
inclusin por lo que la inferencia se efecta condicionalmente sobre la
muestra observada s y no promediada sobre todas las muestras que hayan
sido seleccionadas.

3. yM B es asintticamente insesgado bajo el modelo.

Suponemos que la poblacin nita se introduce en una sucesin de poblan


ciones donde n y N crecen de forma que ( N ) f cuando n . Si
N la distribucin de la variable (x, y) tiende a una distribucin continua con funcines de densidad fx (x) y fy (y) para x y y respectivamente.
Se establecen las siguientes hiptesis:

a ) La funcin de regresin m(x) tiene derivada segunda continua y est


acotada.
b ) La varianza condicional 2 = var(y/x) es continua y acotada.
c ) La funcin de densidad fx es continua y acotada fuera del cero en un
intervalo (a0 , b0 ).
d ) La funcin ncleo K es una funcin de densidad acotada con

0 y x4 K(x)dx < . Ahora consideramos la diferencia:

yM B y =

1
N i
1
N

xK(x)dx =

yi +

mj

yj

yi

j s

i s

1
N

E (mj mj /x) +

j s

1
(mj yj ) =

(mj mj ) + (mj yj ) .

N js
s

Por tanto

E (M B y /x) =
y

=
ya que E (yj ) = mj .

1
N

j s

E (mj mj /x),

j s

1
N

E (mj yj /x)
j s

37

3.2. ESTIMACIONES MODELOS-ASISTIDAS.

Por otra parte el Teorema 3 de Fan y Gijbels (1996) arma que bajo las
condiciones a -d si h 0 y nh , entonces:

E (mj mj /x) =

1
ck m (x)h2 + Op (h2 ),
2

con ck = u2 k(u)du, y m la derivada segunda de m(x). Esto implica que E (mj mj /x) 0, y por tanto yM B es aproximadamente un

estimador asintticamente insesgado bajo el modelo.

3.2. Estimaciones modelos-asistidas.


Breidt y Opsomer proponen un estimador modelo-asistido basado en la regresin no paramtrica, y bajo ciertas hiptesis sobre m(x) obtuvieron un estimador asintticamente insesgado y consistente para la media.

ty =
i s

yi mi

+
i

mi .

i U

Este estimador mejora la eciencia sobre el diseo de los estimadores de


regresin cuando no sabemos de antemano la relacin existente entre la variable
de inters y la variable auxiliar.
En algunas situaciones, la funcin de regresin m() puede presentar discontinuidades. Las hiptesis de suavidad establecidas sobre la funcin de regresin
implican obtener estimadores suaves de la funcin de regresin discontinua, de
modo que se produce un aumento en el sesgo del estimador de regresin. Por
tanto, estos estimadores necesitan ser adaptados si las discontinuidades estn
presentes.

3.2.1. Estimador adaptado a las discontinuidades.


Se propone un estimador de la media poblacional basado en una versin
adaptada del estimador lineal local ncleo (Snchez-Borrego y otros (2006))
para estimar la funcin de regresin discontinua. Este mtodo es el resultado de
combinar el procedimiento de las observaciones proyectadas (Wu y Chu (1993))
junto con la regresin lineal local tipo ncleo (Fan y Gijbels (1996)). El mtodo
propuesto se presenta en dos pasos:
En primer lugar se estima los puntos del salto, y en segundo lugar se estima
la funcin de regresin y la media de la poblacin usando los puntos de salto ya
estimados.
Las observaciones proyectadas son un mtodo para volver a utilizar los datos
disponibles y de este modo aadir nuevas observaciones en la regin localizada
del punto del salto, contribuyendo a mejorar la estimacin de los puntos de

salto. Estas estimaciones se denotan por tk (k = 1, ...., q) y consideramos que


k1 tk para k = 1, ..., q + 1, deniendo t0 = 0 y tq+1 = 1.

t
La idea bsica para estimar la funcin de regresin discontinua consiste en
emplear el estimador lineal local tipo ncleo en los intervalos donde la funcin

38

3.2. ESTIMACIONES MODELOS-ASISTIDAS.

de regresin es continua, es decir, en los intervalos del tipo [tk1 , tk ], y usando


los datos proyectados para agregar nuevas observaciones en la regin lmite de
tales intervalos mejorar la estimacin lineal local ncleo

Estimador propuesto.
La funcin de regresin desconocida m se considera sin prdida de generalidad

m(x) = r(x) + (x),


siendo r una funcin continua y una funcin de salto denida por

(x) =

(3.3)

(tk )1[tk ,1] ,


1kq

para x [0, 1] . q es el nmero de puntos de discontinuidad, tk las localizaciones


de los puntos de discontinuidad y (tk ) nmeros reales distintos a cero que
representan los tamaos del salto de m en tk (k = 1, ..., q).
La media poblacional puede escribirse

1
1
0
0
y=

yj =
yj +
(yj yj ) ,
(3.4)
N
N
j U

j U

j U

o
yj

donde
= m(xj ).

Si los valores m(xj ) son conocidos un estimador insesgado de Y est dado


por:

0
yj yj
1
0
.
yj +
yd =

(3.5)
N
j
j s
j U

En la prctica, los valores m(xj ) son desconocidos por lo que estimamos los
puntos de salto en el contexto general de la regresin no paramtrica y estas
estimaciones sern empleadas en el estimador (3.5).
Para estimar los puntos del salto se consideran

m(x) =

{i:xi [1,2]}

p
Kh (x xi ) {sn,2 (x xi )sn,1 } yi

{i:xi [1,2]} sn,2 sn,0

(sn,1 )2

(3.6)

donde K es una funcin ncleo, x el punto de estimacin con x [0, 1] y xi el


pseudo-punto construido a partir del punto original de diseo,

xi = (1)x1i ,
y

xi = 2 x2ni+1 ,

i = 2 n, 2 n + 1, ..., 0,
i = n + 1, n + 2, ..., 2n 1.

Estos pseudo-puntos son las localizaciones de las observaciones proyectadas


p
en las dos regiones de proyeccin. yi es la observacin proyectada dada por

39

3.2. ESTIMACIONES MODELOS-ASISTIDAS.

i = 2 n, 2 n + 1, ..., 0,
y2i + 2mgL (0)(xi ),
p
yi ,
i = 1, 2, ..., n,
yi =

y2ni + 2mgR (1)(xi 1), i = n + 1, n + 2, ..., 2n 1,

donde m y mgR son dos estimadores tipo ncleo de Priestley y Chao

gL
(1972) con distintas funciones ncleo L y R, dadas por L(x) = (6 12x) y
R(x) = (1)L(x), y un ancho de banda comn g = 1,572h (Wu y Chu (1993)).
Las funciones sn,r estn dadas por

Kh (x xi )(x xi )r .

sn,r =
{i:xi [1,2]}

Finalmente, el procedimiento propuesto para estimar los puntos del salto


se obtiene mediante diferencias de estimaciones que utiliza los datos situados a
la izquierda y a la derecha de un punto dado de estimacin. Consideramos la
funcin siguiente
D(x) = m1 (x) m2 (x),

donde m1 (x) y m2 (x) son estimadores dados en (3.6) con mismo ancho de

banda pero diferentes funciones ncleo K1 y K2 .


Los puntos del salto son nalmente estimados por

t = max|D(x)|,
k
x Ak

k = 1, ..., q,

donde Ak esta dado por


k1

[tl , tl + ], k = 1, ..., q,

Ak = [h, 1 h]
l=1

siendo h el ancho de banda y una constante cercana a cero.


Para estimar la funcin de regresin discontinua consideramos una modicacin de las observaciones proyectadas mencionadas arriba (Snchez-Borrego y
otros (2006)). Sea s U , para j s y yi , i = 1, ..., n, las observaciones proyectadas
estn dadas por
pk
yi = y2i + 2mgL (xj )(xi t ),

i = 2 n, 2 n + 1, ..., 0,
k
pk

yi = y2ni + 2mgR (xj )(xi tk1 ), i = n + 1, n + 2, ..., 2n 1,

j s,
j s,
(3.7)
pk
donde yi = yi para i = 1, ..., n. Los pseudo-puntos, el ancho de banda comn
g y las funcines ncleo mgR y mgL son elegidos bajo idnticas consideraciones.

Finalmente, para cada k = 1, ..., q + 1 y xj [tk1 , tk ] (j s U ) se propone


mj como estimador de los valores m(xj )

q+1

mj =

k=1 {i:xi [2tk1 tk ,2tk tk1 ]}

p
Kh (xj xi ){sn,2 (xj xi )sn,1 }yi k
, j
sn,2 sn,0 (sn,1 )2

s,

40

3.3. ESTIMACIN EN PRESENCIA DE PUNTOS DE CAMBIO.

pk
donde yi son los datos proyectados obtenidos para las observaciones origi

nales yi en los puntos de diseo xi [tk1 , tk ]. Los sn,r estn dados por

Kh (xj xi )(xj xi )r .

sn,r =
{i:xi


[2tk1 tk ,2tk tk1 ]}

Finalmente, la media poblacional es estimada por

1
yj mj

yJP M A =

mj +

,
N
i
j s

(3.8)

j U

propuesto en el contexto del muestreo en poblaciones nitas por Rueda y otros


(2008). Su varianza puede ser estimada empleando las propiedades del estimador
de Horvitz-Thompson en la forma

1
y
V (JP M A ) = 2
N

j,

yj mj y m j j

.
i

j
s

(3.9)

Un estimador alternativo de V (JP M A ) viene dado por:


y

1

V2 (yJP M A ) =

2N 2

j, s

yj mj

y m

j j
.
j

(3.10)

3.3. Estimacin en presencia de puntos de cambio.


El ndice IBEX 35 (Iberia Index) es el principal ndice de referencia de la
bolsa espaola elaborado por Bolsas y Mercados Espaoles (BME). Est formado por las 35 empresas con ms liquidez que cotizan en el Sistema Interconexin
Burstil Electrnico (SIBE) en las cuatro Bolsas Espaolas (Madrid, Barcelona,
Bilbao y Valencia). Es un ndice ponderado por capitalizacin burstil; es decir,
no todas las empresas que lo forman tienen el mismo peso.
En este apartado, se estudia el problema de estimacin de la media poblacional de las acciones del IBEX-35 teniendo en cuenta los puntos de cambio
y considerando que la relacin entre las variables bajo estudio es a priori desconocido. Hay numerosos ejemplos en la vida real donde existen puntos de
cambio. Los puntos de cambio pueden ocurrir en situaciones tales como; el impacto econmico de una regin, un desastre natural causado por un terremoto
o el impacto de un cambio climtico repentino. Se pueden encontrar ejemplos
en medicina, ciencias fsicas, economa, control de calidad, etc.
Consideramos el estimador modelo-asistido de Breidt y Opsomer (2000). Una
aproximacin diferente para estimar la media viene dada por los estimadores
basados en el modelo, que slo predicen los valores no muestrales. Dicho estimador est dado por

41

3.3. ESTIMACIN EN PRESENCIA DE PUNTOS DE CAMBIO.

yM B =

1
N

yj +
j s

1
N

mj .

(3.11)

j U s

Mller y Stadtmller (1999) introdujeron un mtodo de regresin no paramtrica


basado en la funcin de validacin cruzada, para determinando el nmero de
puntos de salto de la funcin de regresin discontinua.
Si hay discontinuidades es necesaria una adaptacin del estimador de regresin no paramtrico. Primero estimamos los puntos del salto y en segundo lugar
la funcin de regresin empleando los puntos de salto estimados.
La funcin de regresin discontinua se estima como resultado de combinar la
regresin polinmica local, introducida por Fan and Gijbels (1996) entre otros,
junto con una versin adaptada del mtodo de las observaciones proyectadas
(ms detalles en Snchez-Borrego y otros. (2006)).
Finalmente el estimador modelo-asistido que preserva las discontinuidades
est dado por
1
yj mj

1
yJP M A =

+
mj ,

(3.12)
N js
j
N
j U

siendo mj el estimador lineal local adaptado a discontinuidades de Snchez


Borrego y otros. (2006).
El correspondiente estimador basado en el modelo y que preserva las discontinuidades est dado por:

yJP M B =

1
N

yj +
j s

1
N

mj ,

(3.13)

j U s

donde mj es el estimador lineal local tipo ncleo adaptado a discontinuidades.

3.3.1. Estudio de simulacin


En este estudio de simulacin se considera las cotizaciones de las acciones del
IBEX 35 desde abril de 2004 hasta octubre del 2005. Estos datos poblacionales
contienen 401 unidades. Se utiliz el mtodo Mller y Stadtmller (1999) de
regresin no paramtrica basado en la funcin de validacin cruzada y se jo un
nmero de punto de salto igual a q = 1 de la funcin de regresin discontinua.
Y a continuacin se compar el rendimiento del estimador modelo-asistido
(yM A ), estimador modelo-asistido que preserva las discontinuidades (yJP M A ),

estimador basado en el modelo (yM B ), estimador basado en el modelo que

preserva las discontinuidades (yJP M B ), estimador de regresin (yREG ) (Singh,

2003) y el estimador de Horvitz-Thompson (yHT ).

Al igual que en los estudios de simulacin de Breidt y Opsomer, se eligen


dos anchos de banda h = 0,1 y h = 0,25 para los estimadores de regresin
no paramtricos. Las muestras se generan por un muestreo aleatorio simple de
tamaos n = 50, n = 75 y n = 100. Se realiza 500 rplicas.

42

3.3. ESTIMACIN EN PRESENCIA DE PUNTOS DE CAMBIO.

Cuadro 3.1: Eciencia relativa de RE para un ancho de banda h = 0,1.

yHT

50
75
100

1
1
1

yM A

yJP M A

yM B

yJP M B

yREG

0.04021
0.01968
0.01647

0.03465
0.01722
0.01341

0.16749
0.02721
0.02545

0.12868
0.01917
0.01733

0.13266
0.10599
0.10371

Cuadro 3.2: Eciencia relativa RE para un ancho de banda h = 0,25.

yHT

50
75
100

1
1
1

yM A

yJP M A

yM B

yJP M B

yREG

0.09759
0.06799
0.06113

0.09664
0.06456
0.06041

0.10372
0.07149
0.06581

0.10623
0.06529
0.06066

0.13266
0.10599
0.10371

Cuadro 3.3: Sesgo relativo absoluto RAB para un ancho de banda h = 0,1.

yHT

50
75
100

0.01020
0.00818
0.00743

yM A

yJP M A

yM B

yJP M B

yREG

0.00106
0.00061
0.00047

0.00101
0.00055
0.00046

0.00289
0.00087
0.00077

0.00242
0.00063
0.00059

0.00372
0.00269
0.00237

Cuadro 3.4: Sesgo relativo absoluto RAB para un ancho de banda h = 0,25.

yHT

50
75
100

0.01095
0.00820
0.00649

yM A

yJP M A

yM B

yJP M B

yREG

0.00129
0.00081
0.00063

0.00123
0.00081
0.00061

0.00369
0.00157
0.00116

0.00121
0.00078
0.00069

0.00372
0.00269
0.00237

Para cada estimador calculamos el sesgo absoluto relativo (RAB)

RAB() =

500
i=1

(si ) y

y la eciencia relativa con respecto al estimador de Horvitz-Thompson

3.4. COMPARACIN ENTRE EL ESTIMADOR BASADO EN EL MODELO Y EL ESTIMADOR


MODELO-ASISTIDO.

RE() =

500
i=1
500
i=1

(si ) y

43

2
2.

(HT (si ) y )
y

donde es la media poblacional del estimador considerado.


Los mtodos que preservan discontinuidades proporcionan mejores resultados que los que no preservan discontinuidades. Por otra parte, los mtodos
modelo-asistido son mejores que los estimadores basados en el modelo en trminos de RE y RAB.

3.4. Comparacin entre el estimador basado en


el modelo y el estimador modelo-asistido.
La comparacin entre el estimador basado en el modelo y el estimador
modelo-asistido no es una cuestin sencilla ya que estn basados en diferentes
principios. El estimador de Breidt and Opsomer (2000) emplea el modelo para
incorporar la informacin auxiliar, pero considera la inferencia bajo el diseo
como el verdadero objetivo del muestreo. El estimador de Breidt y Opsomer es
insesgado bajo el diseo pero no es insesgado bajo el modelo.
Los estimadores basados en el modelo suelen presentar varianzas ms pequea que sus competidores basados en el diseo, especialmente para tamaos
muestrales pequeos donde los estimadores basados en el diseo pueden ser inecaces. Si el modelo est mal especicado la inferencia basada en el modelo
proporciona inferencias peores que las basadas en diseo. La falta de robustez
de algunos estimadores basados en el modelo es una de las razones para preferir
la inferencia basada en el diseo (Kuk and Welsh (2001)). Adems, el estimador
propuesto tiene la ventaja de los estimadores basada en el modelo y no sufre la
falta de robustez como los estimadores paramtricos.

3.5. Estimacin por calibracin de la funcin de


distribucin empleando regresin no paramtrica.
En Rueda y otros (2010) se propone un estimador de calibracin modeloasistido para la funcin de distribucin, empleando mtodos de regresin no
paramtrica. El estimador resultante es una funcin de distribucin que presenta
varias propiedades atractivas.
Cuando se cuenta con informacin auxiliar, existen varios procedimientos
generales de estimacin para obtener estimadores ms ecientes de la media y
de los totales poblacionales. Estos procedimientos generales han sido aplicados
a la estimacin de la funcin de distribucin. Sin embargo, debido a la naturaleza especca de la funcin de distribucin los estimadores resultantes suelen
presentar propiedades poco deseables.

3.5. ESTIMACIN POR CALIBRACIN DE LA FUNCIN DE DISTRIBUCIN EMPLEANDO REGRESIN


NO PARAMTRICA.
44

Recientemente, Rueda y otros. (2007) utilizaron la tcnica de calibracin


propuesta por Deville y Srndal (1992) para proponer un estimador de la funcin
de distribucin bajo la hiptesis de existencia de una relacin lineal entre las
variables bajo estudio.

3.5.1. Modelo de calibracin estimado de la funcin de


distribucin
Consideramos una poblacin U = {1, ..., i, ..., N } y se selecciona una muestras aleatoria s de tamao jo n, segn un diseo de muestreo especicado, con
probabilidades de inclusin i y ij , y asumimos que son estrictamente positivas. Sea y la variable estudio y x la variable auxiliar, yi y xi son los respectivos
valores de estas variables para el isimo elemento de la poblacin. Los valores
de la variable x son conocidos para toda la poblacin pero los valores de y son
conocidos nicamente para las unidades de la muestra seleccionada s. La funcin
de distribucin de y est dada por Fy (t) = i U (t yi )/N , con (t yi ) = 1
si t yi y (t yi ) = 0 en otro caso.
Un estimador basado en el diseo de la funcin de distribucin es el esti
mador de HorvitzThompson, denido por FY H (t) = i s di (t yi )/N con
1

di = i . El estimador FY H (t) es insesgado, pero en general no es una fun


cin de distribucin (l t+ FY H (t) = 1) y no utiliza la informacin auxiliar
m
contenida en x.

Para obtener el estimador de calibracin del modelo Fymc (t) consideramos el


estimador de regresin lineal local ncleo, introducido por Fan y Gijbels (1996),
Ruppert y Wand (1994) entre otros.
Este estimador est dado por:

m(x) = e1 (Xs Ws Xs )1 Xs Ws Xs ,

donde e1 = (1, 0), ys = [yi ]i s , Ws = diag

1
i Kh (xi

(3.14)

x)

i s

, y Xs =

[1(xi x)]i s .
Kh (u) = h1 K(u/h), siendo K una funcin ncleo continua y h el ancho de
banda.
Bajo el modelo yi = m(xi ) + i la informacin auxiliar proporcionada por
la variable auxiliar x debe ser utilizada en la denicin de la pseudo-variable
siguiente:
mi = m(xi ), i U.

(3.15)
Para incorporar la informacin auxiliar proponemos el estimador de calibracin

Fymc (t) =
N

wi (t yi ),

(3.16)

i s

donde los pesos de calibracin wi son modicados desde di reduciendo al


mnimo la medida de la distancia de la Chi-Cuadrado

3.5. ESTIMACIN POR CALIBRACIN DE LA FUNCIN DE DISTRIBUCIN EMPLEANDO REGRESIN


NO PARAMTRICA.
45

s =
i s

(wi di )2
,
d i qi

(3.17)

con qi constantes positivas conocidas sin relacin con di , sujeto a las ecuaciones
de la calibracin

1
N

wi (tj mi ) = Fm (tj ) j = 1, 2, ..., P,

(3.18)

i s

con tj para j = 1, 2, ..., P puntos arbitrariamente elegidos y Fm (tj ) denota

la funcin de distribucin de la pseudo-variable m evaluada en el punto tj y

asumimos t1 < t2 < < tP . Las nuevas condiciones (3.18) son adaptadas para
un supuesto modelo de superpoblacin (1.1) y podemos expresarlos as:

1
N

wi (tj mi ) = Fm (t),

(3.19)

i s

donde hemos denotado por t = (t1 , ..., tP ), Fm (t) = (Fm (t1 ), ..., Fm (tP )) y

(t mi ) = ( (t1 mi ), ..., (tP mi )). Los pesos de calibracin resultantes

hacen mnimo (3.17) sujeto a (3.19) usando la aproximacin de los multiplicadores de Lagrange y son dados por

wi = di +

di qi (t mi )

,
N

(3.20)

donde es el vector de los multiplicadores de Lagrange de dimensin P ,


1

= N 2 (Fm (t) FmH (t)) Tm con FmH (t) = FmH (t1 ), ..., FmH (tP ) y

donde FmH (tj ) denota el estimador de HorvitzThompson para la funcin de


distribucin de m evaluada en los puntos tj .

Si la inversa de Tm = i s di qi (t mi )(t mi ) existe, los nuevos pesos


de calibracin son

wi = di + di qi N Fm (t) FmH (t)

1
Tm (t mi ),

(3.21)

y por tanto el estimador de calibracin para el modelo obtenido sera

Fymc (t) = FY H (t) + Fm (t) FmH (t)

Dm ,

(3.22)

donde Dm = Tm i s di qi (t mi )(t yi ). Si la matriz simtrica Tm

es singular, el proceso de calibracin no tiene solucin y tomamos Fmyc (t) =


Y H (t).
F
El estimador de calibracin propuesto por Rueda y otros (2007) es un caso

particular de Fymc (t) si consideramos el modelo lineal

yi = a + bxi + i

i = 1, ..., N.

3.5. ESTIMACIN POR CALIBRACIN DE LA FUNCIN DE DISTRIBUCIN EMPLEANDO REGRESIN


NO PARAMTRICA.
46

3.5.2. Propiedades del estimador propuesto.

Vamos a determinar si el estimador de calibracin Fymc (t) es una funcin de


distribucin.

Es fcil vericar que Fymc (t) es una funcin de distribucin. Puesto que
ymc (t) es un estimador de calibracin, es montona no decreciente si wk es
F
positivo para todas las unidades de la muestra. La eleccin qk = c garantiza

que wk 0 para todo k s, y por lo tanto el estimador Fyc (t) es montono no


decreciente.

Finalmente, tenemos lim Fymc (t) = 0 pero lim Fymc (t) generalmente no
t

t+

es igual a 1.
Para hacer cumplir esto ltimo observamos que esta condicin es equivalente
a esta otra condicin:

1
N

wk = 1.

(3.23)

k=1

Para aadir (3.23) en las condiciones de calibracin (3.19) tomamos un valor


tP sucientemente grande que garantice Fm (tP ) = 1 (por ejemplo tp = max mj ).

j U

Por tanto Fymc (t) es una funcin de distribucin.


El quantil de la poblacin y es Qy () = inf {t : Fy (t) }. Un procedimiento general para estimar Qy () es obtener un estimador montonamente

no decreciente de la funcin de distribucin Fy (t) y a continuacin estimar el


1
y = inf {t : Fy (t) }.
cuantil tomando la inversa como Qy () = F

Dado que el estimador propuesto Fymc (t) es una funcin de distribucin,

podemos construir los estimadores de Qy () invirtiendo Fymc (t). El nuevo estiymc (t) se dene como
mador de calibracin de Qy () obtenido a partir de F
Qymc () = inf {t : Fymc (t) }.

(3.24)

Captulo 4

Estudio Emprico.
En este captulo estudiamos la eciencia de los mtodos de regresin no
paramtricos para las variables poblacin con ttulos universitarios (variable independiente) y poblacin activa mujeres (variable dependiente) de 166
municipios de la provincia de Granada en el ao 2001. No se han considerado
Motril ni Granada por ser valores extremos.
La plena incorporacin de la mujer a la sociedad y el fuerte crecimiento de la
inmigracin son los dos rasgos ms destacados de la segunda mitad del siglo XX.
La tasa de analfabetismo de la poblacin espaola pas del 63 % en 1900 al 2,4 %
en 2001; esta reduccin ha sido todava ms intensa entre la poblacin femenina
(del 71,4 % en 1900 al 3,4 % en 2001), el porcentaje de mujeres analfabetas
continuaba siendo superior al de la poblacin masculina, aunque dentro de los
parmetros que pueden considerarse normales, dada la mayor esperanza de vida
de las mujeres (3,36 % de mujeres analfabetas frente al 1,55 % de los hombres).
La espectacular mejora en el nivel de formacin de las mujeres espaolas
es uno de los principales cambios experimentados por la poblacin espaola
desde mediados del siglo XX. As, mientras en 1960 el porcentaje de mujeres
con estudios superiores era de un 0,14 %, el 13 % de la poblacin femenina
tena formacin universitaria en 2001, superando ligeramente el porcentaje de
hombres con esa cualicacin (12,6 %).
Se observa por tanto, una extraordinaria evolucin de la situacin de la
mujer, que parta de una realidad de clara discriminacin. Este hecho es especialmente notable desde mediados del siglo XX, coincidiendo con los aos
de fuerte despegue de la economa espaola y con la fractura territorial que
se produjo entonces, como consecuencia de los fuertes movimientos migratorios
interprovinciales.
Se realiz un breve estudio descriptivo de las variables "Poblacin Activa
mujeres" y "Poblacin Activa hombres"). Con los grcos de dispersin
(Figura 4.1 y Figura 4.2) se comprob que la poblacin activa hombres es mucho
mayor que la poblacin activa de mujeres en todos los municipios de la provincia
de Granada, en el caso de las hombres el municipio que cuenta con el menor
nmero de hombres activos es de 30 (Lenteg) y el mayor de 5588 (Almuecar),
47

CAPTULO 4. ESTUDIO EMPRICO.

48

Figura 4.1: Grco de dispersin de la poblacin activa de los hombres en los


municipios de la provincia de Granada.

Figura 4.2: Grco de dispersin de la poblacin activa de las mujeres en los


municipios de la provincia de Granada.

49

CAPTULO 4. ESTUDIO EMPRICO.

mientras que para las mujeres el menor es de 11 (Lenteg) y de 3363 (Baza)en


el mayor.
En el resumen estadstico (Cuadro 4.1) podemos ver que para los hombres
los valores son superiores al de las mujeres tanto en medias de centralizacin
como en las medidas de dispersin.
Se calcularon intervalos de conanza (Cuadro 4.2) para y , as como
contrastes de hiptesis para comparacin de medias(4.1) y varianzas(4.2), y ver
si existian diferencias signicativas.
Cuadro 4.1:

Hombres

Frecuencia
Media
Mediana
Desviacin tpica
Varianza
Mnimo
Mximo
Rango
Primer cuartil
Segundo cuartil
Rango intercuar
Asimetra
Asimetra tipi.
Curtosis
Curtosis tipicada
Coef. de variacin

M ujeres

166
849.84
368
1134.087
1286154
0.941
0.998
5558
193
1047
854
2.34469
12.3329
5.45704
14.3518
133,448 %

166
512.55
234.50
683.929
467758.3
0.01208
0.00056
3352
112
604
492
2.26914
11.9355
4.9138
12,9231
133,437 %

Cuadro 4.2:

Intervalo de conf ianza al 95 %

Hombres

M ujeres

Para
Para

[676.042 ; 1023.63]
[1023.800 ; 1271.22]

[407.738 ; 617.358]
[617.421 ; 766.628]

50

CAPTULO 4. ESTUDIO EMPRICO.

Figura 4.3: Grcos de caja de la poblacin activa de hombres y mujeres de los


municipios de la provincia de Granada.
Bajo las hiptesis de normalidad e igual varianza se contrasta lo siguiente:

H0 : 1 = 2
H1 : 1 = 2

(4.1)

El valor obtenido del t-test fue de t = 3,28135 y su P V alor = 0,00114359,


puesto que el p-valor calculado es inferior a 0.05, se rechaza la hiptesis nula en
favor de la alternativa.
Y para
2
2
H0 : 1 = 2
2
H1 : 2 = 2

(4.2)

F = 2, 74961 mientras que P V alor = 2, 073921010 , y tambin se rechaza


la hiptesis nula en favor de la alternativa.
En este estudio emprico se realizan 1000 rplicas (R = 1000) con tamao
muestral n = 75. La muestra se ha seleccionado mediante un muestra aleatorio
simple con reemplazamiento. Comparamos el rendimiento de los siguientes estimadores para la media: el estimador modelo-asistido (yM A ), estimador basado

en el modelo (yM B ), estimador Horvitz-Thompson (yHT ), estimador de regre

sin clsico (yReg ), estimador de razn (yRaz ) y diferencia (yDif ).

Los estimadores anteriores se comparan en trminos de eciencia relativa


(RE) y sesgo relativo (RB) donde
RE() =

R
i=1
R
i=1

(si ) Y
y HT (si ) Y

2
2

51

CAPTULO 4. ESTUDIO EMPRICO.

RB() =
i=1

(si ) Y
,
Y

siendo R el nmero de replicas y el estimador dado de la media poblacional.


El parmetro ancho de banda, para el estimador basado en el modelo, se
selecciona reduciendo al mnimo la funcin de la validacin cruzada (1.18). El
ancho de banda para el estimador yM A se ha seleccionado segn el criterio (2.17).

Ambos parmetros toman valores en el intervalo [0,05, 1]


Las generaciones al azar, los clculos y los estimadores fueron obtenidos usando el programa de R. Con el Cuadro (4.3) observamos que los estimadores de
regresin no paramtricos demuestran generalmente un funcionamiento satisfactorio con respecto a los estimadores alternativos. Los estimadores paramtricos
regresin, razn y diferencia funcionan bien cuando el modelo de regresin est
bien especicado. Sin embargo los estimadores no paramtricos presentan una
ecacia superior cuando el modelo no esta especicado como es nuestro caso.
Cuadro 4.3:

RE
y HT
yM A
yM B
y Reg
y Raz
y Dif

RB

1
0.587
0.533
0.600
0.941
0.998

0.00056
0.00442
-0.00685
0.00570
0.01208
0.00056

Bibliografa
[1] Breidt, F.J. and Opsomer, J.D. (2000) Local Polynomial Regression
Estimators in Survey Sampling. The Annals of Statistics, Vol. 28, No. 4,
pp. 10261053
[2] Cassell, C.M., Srndal, C.E. and Wretman, J.H. (1977). Foundations of Inference in Survey Sampling. New York. John Wiley.
[3] Chambers, R.L.; Dorfman, A.H. and Wherly, T.E. (1993) Bias
robust estimation in nite populations using nonparametric calibration. J
Am Stat Assoc 88:268277
[4] Chen, J. and Qin, J.(1993). Empirical likelihood estimation for nite
populations and the eective usage of auxiliary information. Biometrika,
80, 107-116.
[5] Deville, J.C. and Srndal, C.E. (1992). Calibration Estimators
in Survey Sampling. Journal of the American Statistical Association.,
87:376382
[6] Dorfman, A.H. (1993). A comparison of design-based and model-based
estimators of the nite population distribution function. Aust J Stat
35:2941
[7] Dorfman, A.H. and Hall, P. (1993). Estimators of the nite population distribution function using nonparametric regression. Ann Stat
16(3):14521475
[8] Fan, J. and Gijbels, I. (1995). Data-driven bandwidth selection in local
polynomial tting: variable bandwidth and spatial adaptation. J R Stat
Soc Ser B 59(2):371394
[9] Fan, J. and Gijbels, I. (1996). Local Polynomial Modelling and Its
Applications. Monographs on Statistics and Applied Probability, Chapman
and Hall, New York. Vol. 66
[10] Georgiev, A.A. (1989). Asymptotic properties of the multivariate
Nadaraya-Watson regression function estimate: the xed design case.
Statistics and Probability Letters, 7, 35-40.
52

BIBLIOGRAFA

53

[11] Grgoire, G. and Hamrouni, Z. (2002) Change-point estimation by


local linear smoothing. Journal of Multivariate Analysis Vol.83, pp.5683
[12] Gijbels, I.; Lambert, A. and Qiu, P. (2004) Jump-preserving regression and smoothing using local linear tting: a compromise. Discussion
Paper, 0401, Institut de Statistique, Universit Catholique de Louvain
[13] Godambe, V. P. and Joshi, V. M. (1965). Admissibilityand Bayes estimation in sampling nite populations I. Ann. Math. Statist. 36 17071722.
[14] Hall, P. (1981) On nonparametric multivariate binary discrimination.
Biometrika, 68, 287-294.
[15] Hall, P. and Wand, M. (1988). On nonparametric discrimination using
density dierences Biometrika, 75, 541-547.
[16] Hall, P. and Titteringtron, D.M. (1992) Edge-preserving and peakpreserving smoothing. Technometrics 34:429440
[17] Horvth, L. and Kokoszka, P. (2002). Change-point detection with
non-parametric regression. Statistics 36, 931. Hosking, J. R. M. (1981)
[18] A. Johnson, F.J. Breidt and J.D. Opsomer. (2008). Estimating distribution functions from survey data using nonparametric regression Journal of Statistical Theory and Practice, 2, 419-431.
[19] Kuo, L. (1988). Classical and Prediction Approaches to Estimating Distribution Functions from Survey Data. Proceeding of the Section on Survey Research Methods. American Statistical Association, 280-285.
[20] Kuk, A.Y.C. and Welsh, A.H. (2001). Robust estimation for nite
populations based on a working model. J R Stat Soc Ser B 63:277292
[21] Loader, C.R. (1996) Change point estimation using nonparametric regression. Ann Stat 24:16671678
[22] Li, Q. Ouyang, D. and Racine, J.S. (2009). Nonparametric with weakly dependent data: the discrete and continuous regressor case. Journal of
Nonparametric Statistics, 21 (6), 697-711.
[23] Li, Q. and J. S. Racine (2008). Nonparametric Estimation of Conditional CDF and Quantile Functions with Mixed Categorical and Continuous
Data. Journal of Business and Economic Statistics, 26 (4), 423-434.
[24] Li, Q. and Racine, J. S. (in press). Smooth Varying-Coecient Estimation and Inference for Qualitative and Quantitative Data. Econometric
Theory.
[25] McDonald, J.A. and Owen, A.B. (1986) Smoothing with split linear
ts. Technometrics 28:195208

BIBLIOGRAFA

54

[26] Mller, H.G. (1992) Change points in nonparametric regression analysis.


Ann Stat 20:737761
[27] Mller, H. G. and Stadtmller, U. (1999) Discontinuous versus
smooth regression. The Annals of Statistics 27(1), pp 299-337 .
[28] Mller, H.G. and Song, K.S. (1997) Two-stage change-point estimators in smooth regression models. Statistic and Probability Letters 34(1),
pp.323335
[29] Muoz Rosas, J.F., lvarez-Verdejo, E. y Snchez-Borrego,
I.R(2008). Revisin de las principales tcnicas de estimacin de parmetros lineales en subpoblaciones. Metodologa de encuestas 10, 77-91.
[30] Opsomer, J.D. and Miller, C.P. (2005) Selecting the amount of
smoothing in nonparametric regression estimation for complex surveys.
Nonparametric Statistics, Vol. 17, No. 5, pp. 593611
[31] Ouyang, D., Q. Li and J. S. Racine (2009). Nonparametric Estimation
of Regression Functions with Discrete Regressors. Econometric Theory, 25
(1), 1-42.
[32] Priestley, M.B. and Chao, M.T. (1972). Nonparametric function tting, J. Roy. Statist. Soc., S. B 34 , pp. 385392.
[33] Qiu, P. (2002) A nonparametric procedure to detect jumps in regression
surfaces. Journal Computational and Graphical Statistics v11, 799822.
[34] Racine, J. S. and Q. Li (2004). Nonparametric Estimation of Regression Functions With Both Categorical and Continuous Data. Journal of
Econometrics, 119 (1), 99-130.
[35] Robinson, P. M. and Srndal, C.E. (1983) Asymptotic properties
of the generalized regression estimation in probabilitysampling. Sankhy.
Ser. B 45 240248.
[36] Rueda, M.; Martnez S, Martnez, H. y Arcos, A. (2007). Estimation of the distribution function with calibration methods. J Stat Plan
Inference 137(2):435448
[37] Rueda, M.; Snchez-Borrego, I.R. and Gonzlez, A. (2008) A new
method for solving the problem of the mean estimation when the underlying regression function is discontinous. International Journal of Computer
Mathematics., 85, 1073 -1082.
[38] Rueda, M., Snchez-Borrego, I.R., Arcos, A.(2009) Mean estimation in the presence of change points. Applied Mathematics Letters, 22,
8, 1257-1261

BIBLIOGRAFA

55

[39] Rueda, M. and Snchez-Borrego, I.R. (2009) A predictive estimator


of nite population mean using nonparametric regression. Computational
Statistics, Vol. 24, 1, pp. 1-14.
[40] Rueda, M., Snchez-Borrego, I.R., Arcos, A. and Martnez,S.
(2010) Model-calibration estimation of the distribution function using
nonparametric regression, 1, 33-44.
[41] Ruppert, D. and Wand, M. P. (1994) Multivariate locally weighted
least squares regression Annals of Statistics, Vol. 22 Number 3, pp. 13461370
[42] Snchez-Borrego, I.R.; Martnez-Miranda, M.D. and Gonzlez,
A. (2006) Local linear kernel estimation of the discontinuous regression
function. Computational Statistics, 21:4, pp.557-569.
[43] Schimek, M.G.(2000). Smoothing and regression John Wiley and Sons
[44] Seifert, B. and Gasser, T. (2000) Data adaptive ridging in local polynomial regression. Journal Computational Statistics 9, pp.338360
[45] Simono, J.S.(1996). Smoothing methods in Statictics Springer-Verlag
[46] Singh, S.(2003) Advanced sampling theory with applications: How
Michael "selected.Amy. Kluwer Academic Publisher. The Netherlands.
[47] Singh, S.; Rueda, M. and Snchez-Borrego, I.R. (2008) Random
non-response in multi-character surveys. Quality and Quantity, p.p 345356
[48] Titterington, D.M. (1980). A comparative study of kernel-based density
estimates for categorical data. Technometrics, 22, 259-268.
[49] Wu J.S. and Chu C.K. (1993b) Modication for boundary eects
and jump points in nonparametric regression. Nonparametric Stat 2:
pp.341354
[50] Wu JS and Chu CK (1993c) Nonparametric function estimation and
bandwidth selection for discontinuous regression functions. Stat Sinica 3,
pp. 557576

Potrebbero piacerti anche