Sei sulla pagina 1di 25

NATURALEZA DEL

ANLISIS DE
REGRESIN

Origen del trmino Regresin


El trmino Regresin fue acuado por Francis Galton
en su Estudio Family Likeness in Stature (1886).
La ley de regresin universal de Galton consiste en
un fenmeno mediante el cual la estatura de los hijos
de padres inusualmente altos o inusualmente bajos
tiende a dirigirse, a regresar, a la estatua promedio de
la poblacin.

Interpretacin moderna de la
regresin
El anlisis de regresin trata del estudio de la
dependencia de una variable (variable dependiente)
respecto de una o ms variables (variables explicativas)
con el objetivo de estimar o predecir la media o valor
promedio poblacional de la primera en trminos de los
valores conocidos o fijos (en muestras repetidas) de las
segundas.*

*Gujarati & Porter (2010). Econometra (4 Edicin). Mxico: Mcgraw-Hill/Interamericana

Ejemplo de anlisis de regresin

Estaturas de los hijos


correspondientes a las
Se busca predecir la estatura
promedio dede
los hijos
partir de
estaturas
los apadres.

la estatura de los padres (valores


fijos).

Para cualquier estatura de un


padre existe un rango de estatura
de los hijos.
Las cruces dentro de los crculos
indican la estatura promedio de
los hijos que corresponde a una
estatura determinada de los
padres.
Dichos promedios se conectan
para obtener la recta de
regresin. A partir de ella se
aprecia que el promedio de la

Diagrama de dispersin

Ejemplo de anlisis de regresin

Estaturas
correspondientes a
edades seleccionadas
Existe un rango
(distribucin) de estaturas
correspondiente a cada
edad.
En promedio, la estatura
se incrementa con la edad.
Si se conoce la edad, se
predice la estatura
promedio de dicha edad
mediante la recta de
regresin

Diagrama de dispersin

Ejemplo de anlisis de regresin

Tasa
de cambio
de los salarios nominales en
La curva
de
esta figura
relacin
con a tasa de desempleo
es un
ejemplo de
la curva de
Phillips.

Permite
predecir el
cambio
promedio en
los salarios
nominales
con una
cierta tasa
de
desempleo.

Ejemplo de anlisis de regresin

Tenencia de dinero
relacin con la
en
Si se mantienen
tasa de inflacin
constantes
otros
factores, cuanto mayor
sea la tasa de inflacin,
menor ser la proporcin
k del ingreso que la
gente desear mantener
en forma de dinero.
Un anlisis cuantitativo
de esta relacin permite
predecir la cantidad de
dinero, como proporcin
del ingreso, que la gente
desear mantener con

Relaciones
Estadsticas

Relaciones deterministas

En las relaciones deterministas, las variables no son aleatorios o


estocsticas. Se determinan automticamente y sin error.

En las relaciones estadsticas entre variables se analizan


variables aleatorias o estocsticas*.
Ejemplo: El rendimiento de un cultivo depende de la
temperatura, lluvia, Sol y fertilizantes. Esta relacin es
estadstica porque las variables explicativas no permiten
predecir de manera exacta el rendimiento del cultivo debido a
los errores propios de la medicin de estas variables y a otra
serie de factores (variables) que en conjunto afectan el
rendimiento pero son difciles de identificar individualmente.

Ejemplo: La ley de la gravedad de Newton.

De haber errores de medicin, por ejemplo, en la G de la ley de


la gravedad, la relacin que de otra forma habra sido
determinista se convierte en una relacin estadstica.

*Una variable aleatoria o estocstica es la que toma cualquier conjunto de valores con una

Regresin y causalidad
A pesar de que el anlisis de regresin tiene que ver
con la dependencia de una variable respecto de otras
variables, esto no implica causalidad necesariamente.
Segn Kendall y Stuart (1961): Una relacin
estadstica, por ms fuerte y sugerente que sea, nunca
podr establecer una conexin causal: nuestras ideas
de causalidad deben provenir de estadsticas externas
y, en ltimo trmino, de una u otra teora.

Anlisis de correlacin
Su objetivo principal es medir la fuerza o el grado de
asociacin lineal entre dos variables, en donde el
coeficiente de correlacin mide esta fuerza de
asociacin.
Regresin
Correlacin

En el anlisis de regresin hay una asimetra en el tratamiento a


las variables dependientes y explicativas.

La variable dependiente es estadstica, aleatoria o


estocstica.

Las variables explicativas tienen valores fijos.

En el anlisis de correlacin, se
tratan dos variables
cualesquiera en forma
simtrica; no hay distincin
entre las variables dependiente
y explicativa. Las dos variables
se consideran aleatorias.

Terminologa
Anlisis de regresin
simple: estudia la
dependencia de una
variable respecto de una
nica variable
explicativa.
Anlisis de regresin
mltiple: estudia la
dependencia de una
variable respecto de
ms de una variable
explicativa.

Tipos de datos
Datos de series de tiempo

Datos transversales

Una serie de tiempo es un conjunto de


observaciones sobre los valores de una variable
en diferentes momentos. Tal informacin debe
recopilarse en intervalos regulares.

Los datos transversales


consisten en datos de
una o ms variables
recopilados en el mismo
punto del tiempo.

Datos combinados

Los datos combinados renen elementos de series de tiempo y transversales.


Datos en Panel: tipo especial de datos combinados en el cual se estudia a
travs del tiempo la misma unidad transversal

Fuentes de datos

Limitaciones de datos

La calidad de los datos no siempre es adecuada:


Los datos para el anlisis emprico pueden provenir de una
dependencia gubernamental, un organismo internacional, una
organizacin privada o un particular.
Los datos recopilados por estas organizaciones pueden ser:

Experimentales: frecuentes en las ciencias naturales, el


investigador suele recabar los datos con algunos factores
constantes, con el fin de evaluar el efecto de otros en un
fenmeno dado.

No experimentales: frecuentes en las ciencias sociales, no


estn sujetos al control del investigador.

Se puede incurrir en errores de observacin (datos no


experimentales) o en errores de medicin (datos experimentales).

Los mtodos de muestreo para obtencin de datos llegan a variar


tanto que a menudo es difcil comparar los resultados de las
diversas muestras.

Las cifras econmicas suelen estar disponibles en niveles muy


agregados que pueden no ilustrar mucho sobre los sujetos o las
microunidades objeto de estudio.

Debido a su carcter confi dencial, ciertos datos slo pueden


publicarse en forma muy agregada.

Escala de medicin de las variables


Escala de razn

Escala de intervalo

Para la variable X, al tomar dos valores X1


y X2, la razn X1/X2 y la distancia (X2 X1)
son cantidades con un significado.
Asimismo, hay un ordenamiento natural
de los valores a lo largo de la escala.

Para la variable X, al tomar los


valores X1 y X2, la distancia (X2 X1)
es una cantidades con significado.
Asimismo, hay un ordenamiento
natural de los valores.

Escala ordinal

Escala nominal

Las variables de esta categora


tienen un ordenamiento
natural.

Las variables de esta categora no


tienen ninguna caracterstica de
las variables en escala de razn.

Anlisis de regresin
con dos variables
Algunas ideas bsicas

Ejemplo
hipottic
o

Los datos de la tabla se refieren a la poblacin total de 60 familias de una


comunidad hipottica, as como a su ingreso semanal (X) y su gasto de
consumo semanal (Y), en dlares. Las 60 familias se dividen en 10 grupos de
ingresos (de 80 dlares a 260); asimismo, aparecen los gastos semanales de
cada familia de los diversos grupos. Por consiguiente, hay 10 valores fijos de X y
los correspondientes valores Y para cada valor X; as, hay 10 subpoblaciones Y.

Se observa una
variacin
considerable en
el consumo
semanal de cada
grupo de
ingreso. No
obstante, en
promedio, el
consumo
semanal se
incrementa a
medida que
aumenta el
ingreso.

Hay 10 valores medios para las 10 subpoblaciones de Y. A estos valores


medios se les llama valores esperados condicionales, en virtud de que
dependen de los valores de la variable (condicional) X. Se denota E(Y|X).

En este caso, el valor esperado incondicional del


consumo semanal, E(Y), se obtiene de sumar los
consumos semanales de las 60 familias que forman la
poblacin y dividir este nmero entre 60:
Los diferentes valores esperados condicionales de Y
varan respecto del valor esperado incondicional de Y,
igual a 121.20 dlares.
Conocer el nivel de ingreso permite predecir mejor el
valor medio del consumo que si se ignora esa
informacin.

Los puntos oscuros dentro de


crculos de la figura muestran
los valores medios
condicionales de Y, graficados
en funcin de los diferentes
valores de X. Al unir esos
valores obtenemos la lnea de
regresin poblacional
(LRP), o, ms general, la
curva de regresin
poblacional (CRP).5 Con
palabras ms sencillas, es la
regresin de Y sobre X.
As, desde el punto de vista
geomtrico, una curva de
regresin poblacional es tan
slo el lugar geomtrico de las
medias condicionales de la
variable dependiente para los
valores fijos de la(s) variable(s)
explicativa(s).

Funcin de regresin poblacional (FRP)


Cada media condicional E(Y|Xi) es funcin de Xi, donde Xi es un
valor dado de X.
Simblicamente,
donde (Xi) denota alguna funcin de la variable explicativa X.
La ecuacin se conoce como funcin de esperanza condicional
(FEC), funcin de regresin poblacional (FRP) o regresin
poblacional (RP).
Qu forma adopta la funcin (Xi)? Como en una situacin real
no disponemos de toda la poblacin para efectuar el anlisis, la
forma funcional de la FRP es una pregunta emprica, aunque en

Por ejemplo, un economista puede plantear que el consumo


manifiesta una relacin lineal con el ingreso. Por tanto, como
primera aproximacin o hiptesis de trabajo, podemos suponer
que la FRP E(Y|Xi) es una funcin lineal de Xi, del tipo

donde 1 y 2 son parmetros no conocidos pero fijos que se


denominan coeficientes de regresin;
La ecuacin se conoce como funcin de regresin
poblacional lineal.
En el anlisis de regresin, la idea es estimar las FRP como la
ecuacin anterior; es decir, estimar los valores no conocidos de
1 y 2 con base en las observaciones de Y y X.

Significado del trmino lineal


El primer significado de linealidad es aquel en
que la esperanza condicional de Y es una funcin
lineal de Xi de la forma:
Geomtricamente, la curva de regresin en este
caso es una recta.

Linealidad en los parmetros


La segunda interpretacin de linealidad se presenta cuando la esperanza
condicional de Y, E(Y|Xi), es una funcin lineal de los parmetros, los ;
puede ser o no lineal en la variable X.
As, los siguientes modelos de E(Y|Xi) son de regresin lineal; es decir, son
modelos lineales en los parmetros.

En adelante, el trmino regresin lineal siempre


significar una regresin lineal en los parmetros; los
(es decir, los parmetros) se elevan slo a la primera
potencia. Puede o no ser lineal en las variables
explicativas X.

Potrebbero piacerti anche