Sei sulla pagina 1di 23

1

TEMA 7
ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACIN
DEPARTAMENTO DE ECONOMA GENERAL Y ESTADSTICA DEPARTAMENTO DE ECONOMA GENERAL Y ESTADSTICA
UNIDAD DOCENTE DE ESTADSTICA Y ECONOMETRA UNIDAD DOCENTE DE ESTADSTICA Y ECONOMETRA
ESTADSTICA EMPRESARIAL ESTADSTICA EMPRESARIAL
2003 2003--2004 2004
DIPLOMATURA EN CIENCIAS EMPRESARIALES DIPLOMATURA EN CIENCIAS EMPRESARIALES
Profesores: David Castilla Espino, Encarnacin Cordn Lagares, Concepcin Corts Rodrguez,
Ramn Jimnez Toribio
2
7.1 Distribuciones Bidimensionales
7.2. Regresin Lineal Mnimo-Cuadrtica
7.3. Coeficiente de Correlacin Lineal. Su interpretacin geomtrica
7.4. Bondad del Ajuste. Coeficiente de Determinacin Lineal
7.5. Prediccin
7.6. La Elasticidad
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
3
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Frecuentemente se analiza ms de un carcter de los individuos de la poblacin.
Es posible el anlisis estadstico descriptivo de cada uno de estos caracteres por separado y
conjuntamente.
A la consideracin conjunta de dos variables X e Y o dos atributos A y B se les denomina variable
bidimensional (X,Y) con valores (x
i
,y
i
) o atributo bidimensional (A,B) con valores (a
i
,b
i
),
respectivamente. Junto con sus frecuencias absolutas constituyen una distribucin bidimensional.
Independencia y relacin funcional de dos variables o atributos
Dependencia
funcional
Independencia
Dependencia
Estadstica
Tipos de caracteres
Atributos
Variables
Tablas de Contingencia
Tablas de Correlacin
7.1. Distribuciones Bidimensionales 7.1. Distribuciones Bidimensionales
4
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Tabla de Correlacin para la variable bidimensional (X,Y)
X \ Y y
1
y
2
... y
j
... y
k
n
i.

x
1
n
11
n
12
... n
1j
... n
1k
n
1.

x
2
n
21
n
22
... n
2j
... n
2k
n
2.

... ... ... ... ... ... ... ...
x
i
n
i1
n
i2
... n
ij
... n
ik
n
i.

... ... ... ... ... ... ... ...
x
h
n
h1
n
h2
... n
hj
... n
hk
n
h.

n
.j
n
.1
n
.2
... n.
i
... n
.k
N

k
j
ij i
n n
1
.

h
i
ij j
n n
1
.


h
i
k
j
ij
k
j
j
h
i
i
n n n N
1 1 1
.
1
.
7.1. Distribuciones Bidimensionales 7.1. Distribuciones Bidimensionales
5
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Distribuciones Marginales
Distribucin marginal de X
Distribucin marginal de Y



h
i
k
j
ij
k
j
j
h
i
i
n n n N
1 1 1
.
1
.
X n
i.

x
1
n
1.

x
2
n
2.

... ...
x
i
n
i.

... ...
x
h
n
h.

N
Y y
1
y
2
... y
j
... y
k

n
.j
n
.1
n
.2
... n
.j
... n
.k
N
7.1. Distribuciones Bidimensionales 7.1. Distribuciones Bidimensionales
6
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Distribuciones Condicionales
Distribucin de X condicionada
a un valor de Y= y
j
Distribucin de Y condicionada
a un valor de X= x
i

h
i
ij j
n n
1
.
x
i
/ y
j
n
i/j

x
1
n
1j

x
2
n
2j

... ...
x
i
n
ij

... ...
x
h
n
hj

n
.j

y
j
/ x
i
y
1
y
2
... y
j
.... y
k

n
j/i
n
i1
n
i2
... n
ij
... n
ik
n
i.

k
j
ij i
n n
1
.
7.1. Distribuciones Bidimensionales 7.1. Distribuciones Bidimensionales
7
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Independencia Estadstica: Dos variables X e Y son independientes estadsticamente si
verifican
j i,
N
n
N
n
N
n
j
i
ij

.
.

Frecuencias relativas condicionadas en caso de independencia:
i.
i.
.
.
.
.
f
n


N n
N
n
n
n
n
f
j
j
i
j
ij
j i
.j
.j
.
.
.
.
f
n


N n
N
n
n
n
n
f
i
j
i
i
ij
i j
7.1. Distribuciones Bidimensionales 7.1. Distribuciones Bidimensionales
8
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Representaciones grficas
Nube de puntos o diagrama de dispersin
Diagrama de barras
Y
X
Y
X
n
ij
Y
X
n
ij
h
ij
c
i
c
j
L
j-1
L
j
L
i-1
L
i
Escalograma
( ) ( )
ij 1 j j 1 i i ij
h L L L L n

7.1. Distribuciones Bidimensionales 7.1. Distribuciones Bidimensionales
9
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
7.1. Distribuciones Bidimensionales 7.1. Distribuciones Bidimensionales
1.- A la covarianza no le afectan los cambios de origen pero s los de escala.



h
i
k
j
j .
. i
j i
h
i
k
j
ij
j i xy
y x
N
n
N
n
y x
N
n
y x S
1 1 1 1
? 0 : Demos
i,j
N
n
N
n
N
n
j .
. i
ij

y x
N
n y x

N
n
) y y ( ) x x ( S
_ _
h
1 i
k
1 j
ij j . . i
h
1 i
k
1 j
ij
_
j .
_
. i xy





Covarianza
Demostracin: Ejercicio
2.- Cuando se realiza un cambio de origen y de escala al mismo tiempo, la covarianza slo
se ve afectada por el cambio de escala.
Demos: (Ejercicio) Si y entonces
xy 2 1 xy
S b b S
i i
x b a x +
1 1 j j
y b a y +
2 2
Independencia
3.- En caso de independencia estadstica de dos variables, la covarianza toma el valor cero.
10
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
(3,11) (4,13) (3,11) (3,12) (3,12) (3,12) (3,13) (3,12) (3,13) (2,11) (2,13) (3,11) (2,13) (2,13)
(2,12) (4,12) (2,12) (3,12) (2,11) (2,12) (4,12) (4,12) (4,13) (2,13) (4,12) (3,13) (3,12) (4.12)
(2,12) (2,13) (2,12) (3,13) (3,11) (4,13) (2,11) (3,11) (3,13) (2,12) (2,12) (4,12) (3,12) (2,11)
(3,11) (2,13) (3,11) (3,12) (3,12) (3,12) (3,12) (2,12)
1.- A un curso de vinos se presentaron 50 variedades diferentes. De cada una, se anot el nmero de
aos de crianza (variable X) y los grados de Alcohol (variable Y). Para cada vino, los datos fueron los
siguientes:
EJEMPLO EJEMPLO
Se pide:
a) La distribucin conjunta (X,Y)
b) Las distribuciones marginales de X (x
i
; n
i.
) y de Y (y
j
; n
.j
).
c) La distribucin del nmero de aos de crianza condicionada a que los vinos tengan 12 de alcohol.
d) La distribucin de los grados de alcohol condicionada a que los vinos sean de 3 o ms aos de
crianza.
e) Son las dos variables X e Y estadsticamente dependientes?
e1) usar la definicin; e2) usar la covarianza.
11
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
X \ Y 11 12 13 n
i.

2 4 8 6 18
3 7 11 5 23
4 0 6 3 9
n
.j
11 25 14 N=50
X n
i.

2 18
3 23
4 9
N 50
Y n
.j

11 11
12 25
13 14
N 50
a) Distribucin conjunta b) Distribuciones marginales de X y de Y
x
i
/ y
j
= 12 n
i / j

2 8
3 11
4 6
n
. j
=25
y
j
/ x
i
3

11 7
12 17
13 8
n
i.
=32

3
2 i
ij
n
d) Distribucin de los grados de alcohol condicionada
a que los vinos sean de 3 o ms aos de crianza
c) Distribucin del n de aos de crianza
condicionada a que los vinos tengan 12 de
alcohol
12
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
03 , 0
50
603
50
141
50
1702
S
xy

N
n
N
n
N
n
1 . . 1 11
e1) Por definicin: las dos variables X e Y son estadsticamente dependientes ya que
EJEMPLO EJEMPLO
X \ Y 11 12 13 n
i.
x
i
n
i.
x
i
2
n
i.

2 4 8 6 18 36 72 218 436
3 7 11 5 23 69 207 274 822
4 0 6 3 9 36 144 111 444
n
.j
11 25 14 50 141 423 603 1702
y
j
n
.j
121 300 182 603
y
j
2
n
.j
1331 3600 2366 7297

3
1 j
ij j
n y

3
1 j
ij j i
n y x


3
1
3
1 i j
ij j i
n y x


1 1
_ _ h
i
k
j
j . . i
xy
y x
N
y x
S



e2) Con la covarianza
13
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
El anlisis de las relaciones existentes entre dos o ms variables requiere en la mayora de las ocasiones de
tratamiento estadstico debido a que:
La estructura verdadera de la relacin no es conocida
No existe dependencia funcional exacta entre las variables consideradas
Enfoques
Grado de dependencia
Estructura de dependencia
Correlacin
Regresin
La eleccin de la familia de curvas apropiada de la distribucin bidimensional es crucial, por lo que ser
necesario la elaboracin de un Diagrama de Dispersin que permita inferir la misma.
7.2. Regresin Lineal Mnimo 7.2. Regresin Lineal Mnimo- -Cuadrtica Cuadrtica
14
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Supone que una distribucin bidimensional responde a una familia de curvas lineales.
Los parmetros de la recta de regresin lineal y* = a +bx resultan de la minimizacin de .

+
+




h
i
h
i
i i
h
i
i i
k
j
ij j i
h
i
i i
k
j
j j
n x b n x a n y x
n x b N a n y
1 1
.
2
1
.
1
1
.
1
.
La solucin a este problema se obtiene mediante el denominado Sistema de Ecuaciones
Normales.
( )



h
i
k
j
ij i j
n x b a y
1 1
2

( ) x - x y - y : Pendiente Punto Ec.



i
2
j
2 2


x
xy
x
xy
x
xy
S
S
x
S
S
y x b y a
S
S
b
El parmetro a representa la ordenada en el origen, esto es el valor que toma la variable
dependiente cuando la variable independiente toma el valor 0.
El parmetro bes la pendiente de la recta de regresin.
7.2. Regresin Lineal Mnimo 7.2. Regresin Lineal Mnimo- -Cuadrtica Cuadrtica
15
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
7.2. Regresin Lineal Mnimo 7.2. Regresin Lineal Mnimo- -Cuadrtica Cuadrtica


y
x
y + y
y
x + x x

tg
x
y
S
S
b
2
x
xy
El signo del parmetro b ser el
signo de la covarianza:
- Si la covarianza es positiva
(negativa) la pendiente de la recta de
regresin lineal tambin lo es.
- Si la covarianza toma el valor cero,
las rectas de regresin sern paralelas
a los ejes de coordenadas.
x
y
0 S
xy
>
Ambas rectas de regresin tienen en comn el
punto:
A la diferencia entre el valor real de la variable
(y) y el valor arrojado por la regresin mnimo-
cuadrtica (y*) se le denomina residuo (e).
( ) y , x
x
y
0 S
xy
<
x
y
0 S
xy

16
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Correlacin: La correlacin hace referencia al grado de dependencia mutua entre dos
variables.
La medicin de la correlacin se basa en el hecho de que cuando la dependencia entre las
variables es exacta o funcional los residuos de la regresin mnimo-cuadrtica toman el valor 0.
Conforme estos residuos crecen en valor absoluto la intensidad de la asociacin entre las variables
ser menor.
Coeficiente de Correlacin Lineal: r Campo de variacin:
Varianza Total
2
2
1
y
ry
S
S
r
1 1 + r
Varianza Residual:
( ) ( )
2
2
2
1
2
1
2
1 1
2
* 2
x
xy
y
h
i
ij
k
j
i
x
xy
j
h
i
ij
k
j
j j ry
S
S
S
N
n
x x
S
S
y y
N
n
y y S

'

1
]
1

+


Coeficiente de Determinacin
2
y
2
ry
2
S
S
1 R 1 R 0
2
+
7.3. Coeficiente de Correlacin Lineal. Su interpretacin Geomt 7.3. Coeficiente de Correlacin Lineal. Su interpretacin Geomtrica rica
17
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Interpretacin analtica y geomtrica del Coeficiente de Correlacin Lineal:
r = -1 ==> S
ry
2
= 0. Correlacin lineal perfecta negativa o inversa. X e Y varan en sentidos opuestos. La recta de
regresin es decreciente:
r = 1 ==> S
ry
2
= 0. Correlacin lineal perfecta positiva o directa.
r = 0 ==> S
ry
2
= S
y
2
. Correlacin lineal nula. Las variables X e Y son independientes.
-1< r < 0 ==> Correlacin lineal negativa o inversa, siendo ms intensa cuanto ms prximo est a 1.
0 < r <+1 ==> Correlacin lineal positiva o directa, siendo ms intensa cuanto ms prximo est a 1.
Ejercicio: Cmo le afectan a r los cambios de escala?
2
2
1
y
ry
S
S
r
y x
xy
2
y
2
x
2
xy
2
y
2
x
2
xy 2
y
S S
S
S S
S
S
S
S
S
1

1 r 1 +
Propiedades del Coeficiente de Correlacin Lineal:
1.- En caso de independencia lineal el coeficiente de correlacin lineal es nulo debido a que en este caso S
XY
= 0.
2.- El coeficiente de correlacin lineal no se ve afectado por cambios de origen.
( ) x -
i
x y -
j
y
x
S
y
S

,
_

x -
i
x y -
j
y
x
S
y
S
0 y -
j
y
7.3. Coeficiente de Correlacin Lineal. Su interpretacin Geomt 7.3. Coeficiente de Correlacin Lineal. Su interpretacin Geomtrica rica
18
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
7.4. Bondad del Ajuste. Coeficiente de Determinacin 7.4. Bondad del Ajuste. Coeficiente de Determinacin
El anlisis de la regresin se basa en el supuesto de que la informacin que suministra la
variable sobre la que se regresa va a mejorar el conocimiento del comportamiento de la otra
variable.
Para ver en que medida se alcanza este objetivo es necesario definir el concepto de Varianza
de la Regresin.
En la regresin se consideran las siguientes variables:
y
j
==> Valores observados de Y.
y*
j
==> Valores tericos de yj para cada xi en la regresin de Y sobre X.
e
j
==> Residuos o errores generados en la regresin mnimo-cuadrtica.
19
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
( ) y 0 y e y
N
n
e y
N
n
y y
h
1 i
k
1 j
ij
j j
h
1 i
k
1 j
ij
* *
j



c) La media de los valores tericos es la media de los valores observados
Las medias aritmticas de cada una de estas variables son:



h
i
k
j
ij
j
N
n
y y
1 1
a) La media de los valores observados de Y
b) La media de los residuos es 0
( ) ( )


'

1
]
1

+
h
i
k
j
ij
i
x
xy
j
h
i
k
j
ij *
j j
h
i
k
j
ij
j
N
n
x x
S
S
y y
N
n
y y
N
n
e e
1 1
2
1 1 1 1
( ) ( ) 0 0
S
S
0
N
n
x x
S
S
N
n
y y
2
x
xy
h
1 i
k
1 j
ij
i
2
x
xy
h
1 i
k
1 j
ij
j
+


7.4. Bondad del Ajuste. Coeficiente de Determinacin 7.4. Bondad del Ajuste. Coeficiente de Determinacin
20
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Dado que la Varianza Residual es:
entonces,
2 2 2
R y e
S S S
Relacin entre las tres varianzas en la regresin lineal
( )
2 2 2 2 2 2 2
1 ] de n [Definici
y y y ry e
S r S r S r S S
y que:
2 2 2
y R
S r S
( )



h
1 i
k
1 j
ij 2
j
2
y
N
n
y y S
( ) ( )



h
1 i
k
1 j
ij
2
*
j
h
1 i
k
1 j
ij
2
* *
j
2
R
N
n
y y
N
n
y y S
( ) ( )
2
ry
h
1 i
k
1 j
ij
*
j j
h
1 i
k
1 j
ij
2
h
1 i
k
1 j
ij 2
j
2
e
S
N
n
y y
N
n
e
N
n
e e S
j



Varianza Total
Varianza Residual
Varianza debida a la Regresin
Las tres varianzas son:
2 2 2
e R y
S S S +
7.4. Bondad del Ajuste. Coeficiente de Determinacin 7.4. Bondad del Ajuste. Coeficiente de Determinacin
21
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
Interpretacin analtica del Coeficiente de Determinacin Lineal:
R
2
representa el porcentaje de la varianza explicada por el modelo.
R
2
= 1 ==> S
ry
2
= 0. La recta de regresin elegida es buena y ajusta
perfectamente a la nube de punto.
R
2
= 0 ==> S
ry
2
= S
y
2
. La recta de regresin elegida no es buena o bien las
variables X e Y son independientes.
Cuanto ms se acerque R
2
a 1 mejor ser el ajuste.
Coeficiente de Determinacin Lineal: R
2
Si se dividen ambos miembros de la igualdad anterior por S
2
y
, obtenemos R
2
2
2
2
2
2
2
2
2
2
1 1 R
S
S
S
S
S
S
S
S
y
ry
y
R
y
ry
y
R
+
Variacin de Y explicada
por la recta de regresin
Variacin de Y no explicada
por la recta de regresin
R
2
es una medida de
la bondad del ajuste
1 0
2
R
7.4. Bondad del Ajuste. Coeficiente de Determinacin 7.4. Bondad del Ajuste. Coeficiente de Determinacin
22
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION
7.5. Prediccin 7.5. Prediccin
7.6. Elasticidad 7.6. Elasticidad
Sea p el precio de demanda de un bien determinado y q la cantidad demandada de ese
bien, se define la elasticidad de la cantidad demandada con respecto al precio como:
De la recta de regresin y*= a +bx se tiene que la prediccin de Y para X = x
0
es:
( ) x - x y y
0
2
0
+
x
xy
S
S
q
p
dp
dq
p , q

Interpretacin: La elasticidad es el porcentaje de variacin de la variable
dependiente (Y) cuando la independiente (X) aumenta un 1%.
23
2.- El ingreso anual disponible y los gastos de consumo de 12 familias de una ciudad han sido, en cientos de
euros, los siguientes:
INGRESO: 8 15 20 25 25 25 8 13 7 6 12 15
CONSUMO: 8 12 13 30 20 24 8 11 7 6 10 14
a) Ajustar por mnimos-cuadrados una recta en la que el consumo sea funcin de los ingresos.
b) Representa grficamente mediante un diagrama de dispersin el ingreso y el consumo as como la recta
obtenida en el apartado a).
c) Explicar el significado estadstico y econmico de los coeficientes de la recta de regresin del apartado
anterior.
d) Hallar e interpretar el coeficiente de correlacin lineal.
e) Analizar la bondad del ajuste.
f) Hallar el incremento porcentual que experimenta el consumo de una familia cuyos ingresos fueron de 800
euros ante un incremento porcentual unitario de estos ltimos.
3.- Entre las variables X e Y se ha obtenido la siguiente relacin lineal:
Y* = 2,5 0,7 X R
2
= 0,89
Hallar la elasticidad de Y con respecto a X en el punto en que X = 4,8 y comentar el valor obtenido.
EJEMPLOS EJEMPLOS
TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y TEMA 7. ANLISIS DE DOS VARIABLES. REGRESIN Y
CORRELACION CORRELACION

Potrebbero piacerti anche