Sei sulla pagina 1di 54

AL

N E
LI
N
SIÓ
E 9
G R E O
E L L
R MP T U
S I P Í
A
C
I. RELACIÓN LINEAL Y NO LINEAL
I. Relación lineal y no lineal
RELACIÓN ENTRE VARIABLES
CUANTITATIVAS EN GRAFICO
X/Y
I. Relación lineal y no lineal
RELACIÓN ENTRE VARIABLES
CUANTITATIVAS EN GRAFICO
30000000
20000000
ingreso del trabajo
10000000
X/Y

20
0

0 20 40 60

15
o10. horas de trabajo, empleo principal

escolaridad
10 5
0
0 20 40 60 80 100
edad
I. Relación lineal y no lineal

RELACIÓN LINEAL ENTRE


VARIABLES

Efecto de una variable en otra es constante


II. COVARIANZA Y CORRELACIÓN
II. COVARIANZA Y CORRELACIÓN

COVARIANZA
𝑛
  ∑ ( 𝑥𝑖 − ´
𝑥 )( 𝑦𝑖 − 𝑦 )
𝑖= 1
𝐶𝑜𝑣 ( 𝑥 , 𝑦 ) =
𝑛 −1

 ´𝑦  ´𝑦  ´𝑦

𝑥
 ´ 𝑥
 ´ 𝑥
 ´

Problema: Depende de nivel medida de la variable, por tanto no es fácil de interpretar


II. COVARIANZA Y CORRELACIÓN

CORRELACIÓN DE PEARSON
Medida de relación lineal entre dos variables cuantitativas.

 
=

r=-1 Correlación negativa perfecta


r=0Nula correlación*
r=+1Correlación positiva perfecta
II. COVARIANZA Y CORRELACIÓN

CORRELACIÓN DE PEARSON
 r=-1 Correlación negativa perfecta
r Correlación negativa de alta intensidad
r Correlación negativa de mediana intensidad
r Correlación negativa de baja intensidad
r Correlación negativa de muy baja intensidad
r=0 Nula correlación*
r Correlación positiva de muy baja intensidad
r Correlación positiva de baja intensidad
r Correlación positiva de mediana intensidad
r Correlación positiva de alta intensidad
r=1 Correlación positiva perfecta

Si trabajamos con muestras:


Test de hipótesis: H0r=0, H1r≠0
Correlación (R ) de las X y las Y
Correlación Positiva Correlación Negativa
25
Evidente 25
Evidente
20 20

15 15
Y 10

Y
10
5
5
0
0 5 10 15 20 25 Sin Correlación 0
0 5 10 15 20 25
X 25
R=1 20
X
R=-1
15

Correlación 10

Y
5
Correlación
25
Positiva 0 Negativa
0 5 10 15 20 25 25
20

15
X
R=0 20

15
Y

10

Y
10
5
5
0
0 5 10 15 20 25 0
0 5 10 15 20 25
X
R=>1 X
R=>-1

10
II. COVARIANZA Y CORRELACIÓN

CORRELACIÓN DE PEARSON
REGRESIÓN LINEAL CON N PUNTOS: Y= a+bX
X Y g
---------------------------------------------------
X1 Y1 Y1-a-bX1
X2 Y2 Y2-a-bX2
X3 Y3
X 4 Y4
…… …… …………………….
Xn Yn Yn – a - bXn
 

REGRESIÓN LINEAL POR MÍNIMOS CUADRADOS


.

Tomemos las derivadas parciales de G respecto de a y b que son las incógnitas y las igualamos a cero;
de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser
resueltas por cualquier método ya sea igualación o matrices para obtener los valores de a y b.

a=y︠ - bx︠
Luego Derivamos parcialmente G respecto de b
 

.
EJEMPLO 1
Se toma una muestra aleatoria de 8 ciudades de una región geográfica de 13 departamentos y se determina por los
datos del censo el porcentaje de graduados en educación superior y la mediana del ingreso de cada ciudad, los
resultados son los siguientes:  
CIUDAD : 1 2 3 4 5 6 7 8
% de (X)
Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2
Ingreso (Y)
Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (000)
Y X XY X²
       
4.2 7.2 30.24 51.84
4.9 6.7 32.83 44.89
7.0 17.0 119.00 289.00
6.2 12.5 77.50 156.25
3.8 6.3 23.94 39.69
7.6 23.9 181.64 571.21
4.4 6.0 26.40 36.00
5.4 10.2 55.08 104.04
43.5 89.8 546.63 1292.92
SOLUCIÓN CON PROGRAMA DE MÍNIMOS CUADRADOS

clc;clear;n=8;
x=[7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2];xm=sum(x)/n;
y=[4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 ];ym=sum(y)/n;
Sxy=x*y'; XY=x.*y’;
Sx2=x*x';X2=X.*X;
Sx=sum(x); Sy=sum(y);
A=[x’ y’ XY’ X2’]; disp(A);
disp([Sx Sy Sxy Sx2]);
b=(Sxy-n*xm*ym)/(Sx2-n*xm^2)
a=ym-b*xm
x9=10;
y9=a+b*x9
FORMA SINTÉTICA
clc;clear;
x=[7.2; 6.7; 17.0; 12.5; 6.3; 23.9; 6.0; 10.2];
y=[4.2; 4.9; 7.0; 6.2; 3.8; 7.6; 4.4; 5.4];
n=8; plot(x,y);
xm=sum(x)/n;ym=sum(y)/n;
b=(x*y'-n*xm*ym)/(x*x'-n*xm^2)
a=ym-b*xm
Xi=5; yi=a +b*Xi
EJ 2.- ECONTRAR Y PARA Xi=3, SI X=[0 2 4 6 8];Y=[-3 4 0 6 -1];
clc;clear;
x=[0 2 4 6 8];y=[-3 4 0 6 -1];n=5;
xm=sum(x)/n;ym=sum(y)/n;
b=(x*y'-n*xm*ym)/(x*x'-n*xm^2)
a=ym-b*xm;
Xi=3;
y=a +b*Xi
PROBLEMA 3
Un tractor se compró a precio de fábrica el 2005 a US/. 360000, el 2007 le ofrecieron US/.320000, el 2009
le ofrecieron US/.290000, el 2011 se valorizó en US/.260000 el 2013 en 260000.¿Cuál fue su valor el
2015?

clc;clear;
x=[2005 2007 2009 2011];y=[360000 320000 290000 260000];n=4;
xm=sum(x)/n;ym=sum(y)/n;
b=(x*y'-n*xm*ym)/(x*x'-n*xm^2)
a=ym-b*xm;
Xi=2015;
y=a +b*Xi
REGRESIÓN LINEAL DE FORMAS CUADRÁTICA, CÚBICA, ….

CUANDO LAS MUESTRAS SON GRANDES se utiliza una


función interpoladora de tipo polinómico de grado n
MÉTODO MATRICIAL.- DE MÍNIMOS CUADRADOS
Los polinomios son de las formas.
Derivando respecto a cada uno de
los coeficientes nos da el planteamiento un sistema de ecuaciones de la
siguiente forma (donde m es el número de pares de datos):
Ejemplo 1.- Por regresión polinomial calcule y(5), si
x= 1 1.2 1.5 2 3 3.7 4 4.5
y= 3 3.4 5 2 4.1 5 7 6.5
Solución
clc;clear;n=8;
x=[1;1.2;1.5;2;3;3.7; 4;4.5];
y=[3;3.4;5;2;4.1;5;7;6.5];
plot(x,y);grid;
Por la gráfica, se observa que hay una tendencia cuadrática y lo enfrentamos como tal, es decir lo
ajustamos a la forma:
y = a + bx + c x^2
. Usando una Matriz para calcular valores de los coeficientes

x y xy x2 y2 x2y x3 x4
1 3 3 1 9 3 1 1
1.2 3.4 4.08 1.44 11.56 4.896 1.728 2.0736
1.5 5 7.5 2.25 25 11.25 3.375 5.0625
2 2 4 4 4 8 8 16
3 4.1 12.3 9 16.81 36.9 27 81
3.7 5 18.5 13.69 25 68.45 50.653 187.4161
4 7 28 16 49 112 64 256
4.5 6.5 29.25 20.25 42.25 131.625 91.125 410.0625
. 20.9
Σ= Σ= 36 Σ= 106.63 Σ= 67.63 Σ= 182.62 Σ= 376.121 Σ= 246.881 Σ 958.6147
Solución del Ejemplo 1
clc;clear;n=6;
x=[1,1.2,1.5,2,3,3.7, 4,4.5]; y=[3,3.4,5,2,4.1,5,7,6.5];
plot(x,y);grid;
A=[n,sum(x),x*x' ,sum(y);
sum(x),x*x',sum(x.^3), x*y';
x*x', sum(x.^3), sum(x.^4), sum(x.^2*y')]
D=rref(A)
xi=5;
yi=D(1,4)+D(2,4)*xi+D(3,4)*xi^2
Ejecutando este Programa obtenemos
GRÁFICA DEL EJEMPLO 1

6.5

5.5

4.5

3.5

2.5

2
1 1.5 2 2.5 3 3.5 4 4.5
A=
8.00 20.90 67.63 36.00
20.90 67.63 246.88 106.63
67.63 246.88 958.61 376.12

D=
1.00 0.00 0.00 4.58
0.00 1.00 0.00 -1.52
0.00 0.00 1.00 0.46

yi = 8.51
Ejemplo 2.- Por regresión polinomial calcule y(0), si
x=1 1.2 1.5 2 3 3.7 4 4.5
y=3 3.4 5 2 4.1 5 7 8
Solución en Octave
clc;clear;n=8;
x=[1,1.2,1.5,2,3,3.7,4,4.5];
y=[3,3.4,5,2,4.1,5,7,8];
plot(x,y);grid;
A =[n,sum(x),x*x', sum(x.^3),sum(y);
sum(x),x*x',sum(x.^3), sum(x.^4),x*y';
x*x', sum(x.^3), sum(x.^4), sum(x.^5),x.^2*y';
sum(x.^3),sum(x.^4),sum(x.^5),sum(x.^6), x.^3*y']
D=rref(A)
xi=5;
yi=D(1,4)+D(2,4)*xi+D(3,4)*xi^2+D(4,4)*xi^3
Ejecutando este programa obtenemos
GRÁFICA DEL EJEMPLO 2
.
8

2
1 1.5 2 2.5 3 3.5 4 4.5
A=
8.00 20.90 67.63 246.88 37.50
20.90 67.63 246.88 958.61 113.38
67.63 246.88 958.61 3848.80 406.50
246.88 958.61 3848.80 15773.87 1582.72

D=
1.00 0.00 0.00 0.00 4.11
0.00 1.00 0.00 0.00 -0.47
0.00 0.00 1.00 0.00 -0.20
0.00 0.00 0.00 1.00 0.11

yi = 4.11
EJ 3.
x=[0 1 2 3 4 5 6];
Y=[0 0.9 1 0.2 -0.9 -1 -0.3];

Encontrar Y(1.5)
Y(4.5)
Y(5.5)
SOLUCION CON PROGRAMA DE OCTAVE
clc;clear;n=7;
x=[0 1 2 3 4 5 6];
y=[0 0.9 1 0.2 -0.9 -1 -0.3];
plot(x,y);grid;
A =[n,sum(x),x*x', sum(x.^3),sum(y);
sum(x),x*x',sum(x.^3), sum(x.^4),x*y';
x*x', sum(x.^3), sum(x.^4), sum(x.^5),x.^2*y';
sum(x.^3),sum(x.^4),sum(x.^5),sum(x.^6), x.^3*y']
D=rref(A)
xi=1.5;
yi=D(1,5)+D(2,5)*xi+D(3,5)*xi^2+D(4,5)*xi^3
RESULTADO DE EJECUCIÓN, Y(1.5)
A=
7.00 21.00 91.00 441.00 -0.10
21.00 91.00 441.00 2275.00 -6.90
91.00 441.00 2275.00 12201.00 -43.50
441.00 2275.00 12201.00 67171.00 -233.10
D=
1.00 0.00 0.00 0.00 -0.05
0.00 1.00 0.00 0.00 1.89
0.00 0.00 1.00 0.00 -0.91
0.00 0.00 0.00 1.00 0.10

Y(1.5) = 1.09, y(4.5) = -1.01, y(5.5)= -0.86


EJEMPLO 4.-
Una casa en cierta ciudad en la década del 60 costaba $4000, en la década del 70 estaba en $10000 dólares, en los 80 estaba en $20000, en los
clc;clear;n=6; 90 estaba en $50000, en los 2000 estaba $90000, en los 2010 estaba $140000, ¿qué precio se espera en la siguiente década? Y=a+
bx + cx^2

x=[1960 1970 1980 1990 2000 2010];y=[4000 10000 20000 50000 90000 140000];
plot(x,y);grid;
x2=x.^2;xy=x.*y;x3=x.^3;x4=x.^4;Sx=sum(x);x2y=x2.*y;
Sy=sum(y);n=3;Sxy=sum(xy);
Sx2=sum(x2);Sx3=sum(x3);Sx4=sum(x4);Sx2y=sum(x2y);
A=[x y xy x2 x2y x3 x4];disp(A);
xm=Sx/n;Sy=sum(y);ym=Sy/n;S=[Sx,Sy,Sxy,Sx2,Sx2y, Sx3, Sx4];disp(S);
Si=[n Sx Sx2 Sy;Sx Sx2 Sx3 Sxy;Sx2 Sx3 Sx4 Sx2y];
xi=2020;
D=rref(Si);Pm=D(:,4);xi=2020;
yi=D(1,4)+D(2,4)*xi+D(3,4)*xi^2
4
x 10
14

12

10

0
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
IV. REGRESIÓN LINEAL MÚLTIPLE
IV. REGRESIÓN LINEAL MÚLTIPLE

EL MODELO

rs
a
ye
IV. REGRESIÓN LINEAL MÚLTIPLE

El modelo: Variables

Y = a+ X1 b1+…+ Xk bk +e
Variable
Dependiente
CUANTITATI Variables independiente
VA CUANTITATIVAS
O DUMMY
IV. REGRESIÓN LINEAL MÚLTIPLE

El modelo: parámetros

Y = a+ X1 b1+…+ Xk bk +e
Constante

Efecto de X en Y
(controlando por las demás
X)
IV. REGRESIÓN LINEAL MÚLTIPLE
ESTIMACIÓN DEL MODELO
Estimador Estimador del Coeficiente
de la del Modelo: Indica el
Constante efecto de X en Y
Y = a+ X1 b1+…+ Xk bk

Variable
Dependiente Variables
Predicha Independientes
NOTACIÓN MATRICIAL: Y =X*Β < --- > Y= X*B

Entonces la solución de mínimos cuadrados para la estimación de b o β que se ilustra en la sección Estimación de coeficientes,
"Regresión lineal múltiple" implica encontrar b para la que
SSE = (y - Xb)'(y - Xb)
se minimiza, al resolver para b en la ecuación
El resultado se reduce a la solución de b en

(X'X)b = X'y

Nótese la naturaleza de la matriz X. Aparte del elemento inicial, el i-ésimo


renglón representa los valores x que dan lugar a la respuesta yi. Al escribir
las ecuaciones normales se pueden escribir en la forma matricial
Ab=g
Si la matriz A es no singular, podemos escribir la solución para el coeficiente de
regresión como
b = A-1 g =(X’X)-1 X’y
De esta forma se puede obtener la ecuación de predicción o la ecuación de
regresión al resolver un conjunto de k + 1 ecuaciones con un número igual de
incógnitas. Esto implica la inversión de la matriz X'X de k + 1 por k + 1.
Se dispone de muchos paquetes de computadora de alta velocidad para 
problemas de regresión múltiple, paquetes que no sólo imprimen estimaciones
de los coeficientes de regresión, sino que también proporcionan otra 
información relevante para hacer inferencias respecto a la ecuación de
regresión.
EJEMPLO

Se realizó un estudio sobre un camión de reparto ligero a diesel


para ver si la humedad, temperatura del aire y presión barométrica
influyen en la emisión de óxido nitroso (en ppm). Las mediciones de
las emisiones se tomaron en diferentes momentos, con condiciones
experimentales variantes. Los datos son los siguientes:
.

Óxido nitroso, Humedad Temperatura Presión Óxido nitroso Humedad Temperatura Presión
y x1 x2 x3 y x1 x2 x3
0,90 72,4 76,3 29,18 1,07 23,2 76,8 29,38
0,91 41,6 70,3 29,35 0,94 47,4 86,6 29,35
0,96 34,3 77,1 29,24 1,10 31,5 76,9 29,63
0,89 35,1 68,0 29,27 1,10 10,6 86,3 29,56
1,00 10,7 79,0 29,78 1,10 11,2 86,0 29,48
1,10 12,9 67,4 29,39 0,91 73,3 76,3 29,40
1,15 8,3 66,8 29,69 0,87 75,4 77,9 29,28
1,03 20,1 76,9 29,48 0,78 96,6 78,7 29,29
0,77 72,2 77,7 29,09 0,82 107,4 86,8 29,03
1,07 24,0 67,7 29,60 0,95 54,9 70,9 29,37
.

El modelo es:
Y|x1, x2, x3 = b 0 + b 1 x1 + b 2 x2 +……..+ b 3 x3
Ajuste este modelo de regresión lineal múltiple a los datos dados
y después estime la cantidad de óxido nitroso para las
condiciones donde la humedad es 50%, la temperatura 76°F y
la presión barométrica 29,30.
SOLUCIÓN

.
.

La solución de este conjunto de ecuaciones da las estimaciones


únicas
b0 = -3.507778, b1= -0.002625, b2= 0.000799, b3= 0.154155.

Y= -3.507778 -0.002625X1+ 0.000799X2+ 0.154155X3


EJEMPLO 2

Se midió el porcentaje de sobrevivencia de cierto tipo de semen animal,


después del almacenamiento, en varias combinaciones de concentraciones
de tres materiales que se utilizan para aumentar su oportunidad de
sobrevivencia. Los datos están en la tabla de abajo

Estime el modelo de regresión lineal múltiple para los datos dados y evalúe
la respuesta cuando x1=3, x2=6 y x3=9.
W X Y Z
25.5 1.74 5.30 10.80
31.2 6.32 5.42 9.40
25.9 6.22 8.41 7.20
38.4 10.52 4.63 8.50
18.4 1.19 11.60 9.40
26.7 1.22 5.85 9.90
26.4 4.10 6.62 8
25.9 6.32 8.72 9.10
32 4.08 4.42 8.70
25.2 4.15 7.60 9.20
39.7 10.15 4.83 9.40
35.7 1.72 3.12 7.60
26.5 1.70 5.30 8.20
SOLUCIÓN

De donde obtenemos la matriz inversa de los coeficientes


y después, con el uso de la relación b = (X’X)-1 X’y, los coeficientes estimados de
regresión son
b0= 39.1574, b1 = 1.0161, b2 = -1.8616, b3 = -0.3433.
De aquí nuestra ecuación de regresión estimada es

Potrebbero piacerti anche