Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
N E
LI
N
SIÓ
E 9
G R E O
E L L
R MP T U
S I P Í
A
C
I. RELACIÓN LINEAL Y NO LINEAL
I. Relación lineal y no lineal
RELACIÓN ENTRE VARIABLES
CUANTITATIVAS EN GRAFICO
X/Y
I. Relación lineal y no lineal
RELACIÓN ENTRE VARIABLES
CUANTITATIVAS EN GRAFICO
30000000
20000000
ingreso del trabajo
10000000
X/Y
20
0
0 20 40 60
15
o10. horas de trabajo, empleo principal
escolaridad
10 5
0
0 20 40 60 80 100
edad
I. Relación lineal y no lineal
COVARIANZA
𝑛
∑ ( 𝑥𝑖 − ´
𝑥 )( 𝑦𝑖 − 𝑦 )
𝑖= 1
𝐶𝑜𝑣 ( 𝑥 , 𝑦 ) =
𝑛 −1
𝑥
´ 𝑥
´ 𝑥
´
CORRELACIÓN DE PEARSON
Medida de relación lineal entre dos variables cuantitativas.
=
CORRELACIÓN DE PEARSON
r=-1 Correlación negativa perfecta
r Correlación negativa de alta intensidad
r Correlación negativa de mediana intensidad
r Correlación negativa de baja intensidad
r Correlación negativa de muy baja intensidad
r=0 Nula correlación*
r Correlación positiva de muy baja intensidad
r Correlación positiva de baja intensidad
r Correlación positiva de mediana intensidad
r Correlación positiva de alta intensidad
r=1 Correlación positiva perfecta
15 15
Y 10
Y
10
5
5
0
0 5 10 15 20 25 Sin Correlación 0
0 5 10 15 20 25
X 25
R=1 20
X
R=-1
15
Correlación 10
Y
5
Correlación
25
Positiva 0 Negativa
0 5 10 15 20 25 25
20
15
X
R=0 20
15
Y
10
Y
10
5
5
0
0 5 10 15 20 25 0
0 5 10 15 20 25
X
R=>1 X
R=>-1
10
II. COVARIANZA Y CORRELACIÓN
CORRELACIÓN DE PEARSON
REGRESIÓN LINEAL CON N PUNTOS: Y= a+bX
X Y g
---------------------------------------------------
X1 Y1 Y1-a-bX1
X2 Y2 Y2-a-bX2
X3 Y3
X 4 Y4
…… …… …………………….
Xn Yn Yn – a - bXn
Tomemos las derivadas parciales de G respecto de a y b que son las incógnitas y las igualamos a cero;
de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser
resueltas por cualquier método ya sea igualación o matrices para obtener los valores de a y b.
a=y︠ - bx︠
Luego Derivamos parcialmente G respecto de b
.
EJEMPLO 1
Se toma una muestra aleatoria de 8 ciudades de una región geográfica de 13 departamentos y se determina por los
datos del censo el porcentaje de graduados en educación superior y la mediana del ingreso de cada ciudad, los
resultados son los siguientes:
CIUDAD : 1 2 3 4 5 6 7 8
% de (X)
Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2
Ingreso (Y)
Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (000)
Y X XY X²
4.2 7.2 30.24 51.84
4.9 6.7 32.83 44.89
7.0 17.0 119.00 289.00
6.2 12.5 77.50 156.25
3.8 6.3 23.94 39.69
7.6 23.9 181.64 571.21
4.4 6.0 26.40 36.00
5.4 10.2 55.08 104.04
43.5 89.8 546.63 1292.92
SOLUCIÓN CON PROGRAMA DE MÍNIMOS CUADRADOS
clc;clear;n=8;
x=[7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2];xm=sum(x)/n;
y=[4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 ];ym=sum(y)/n;
Sxy=x*y'; XY=x.*y’;
Sx2=x*x';X2=X.*X;
Sx=sum(x); Sy=sum(y);
A=[x’ y’ XY’ X2’]; disp(A);
disp([Sx Sy Sxy Sx2]);
b=(Sxy-n*xm*ym)/(Sx2-n*xm^2)
a=ym-b*xm
x9=10;
y9=a+b*x9
FORMA SINTÉTICA
clc;clear;
x=[7.2; 6.7; 17.0; 12.5; 6.3; 23.9; 6.0; 10.2];
y=[4.2; 4.9; 7.0; 6.2; 3.8; 7.6; 4.4; 5.4];
n=8; plot(x,y);
xm=sum(x)/n;ym=sum(y)/n;
b=(x*y'-n*xm*ym)/(x*x'-n*xm^2)
a=ym-b*xm
Xi=5; yi=a +b*Xi
EJ 2.- ECONTRAR Y PARA Xi=3, SI X=[0 2 4 6 8];Y=[-3 4 0 6 -1];
clc;clear;
x=[0 2 4 6 8];y=[-3 4 0 6 -1];n=5;
xm=sum(x)/n;ym=sum(y)/n;
b=(x*y'-n*xm*ym)/(x*x'-n*xm^2)
a=ym-b*xm;
Xi=3;
y=a +b*Xi
PROBLEMA 3
Un tractor se compró a precio de fábrica el 2005 a US/. 360000, el 2007 le ofrecieron US/.320000, el 2009
le ofrecieron US/.290000, el 2011 se valorizó en US/.260000 el 2013 en 260000.¿Cuál fue su valor el
2015?
clc;clear;
x=[2005 2007 2009 2011];y=[360000 320000 290000 260000];n=4;
xm=sum(x)/n;ym=sum(y)/n;
b=(x*y'-n*xm*ym)/(x*x'-n*xm^2)
a=ym-b*xm;
Xi=2015;
y=a +b*Xi
REGRESIÓN LINEAL DE FORMAS CUADRÁTICA, CÚBICA, ….
x y xy x2 y2 x2y x3 x4
1 3 3 1 9 3 1 1
1.2 3.4 4.08 1.44 11.56 4.896 1.728 2.0736
1.5 5 7.5 2.25 25 11.25 3.375 5.0625
2 2 4 4 4 8 8 16
3 4.1 12.3 9 16.81 36.9 27 81
3.7 5 18.5 13.69 25 68.45 50.653 187.4161
4 7 28 16 49 112 64 256
4.5 6.5 29.25 20.25 42.25 131.625 91.125 410.0625
. 20.9
Σ= Σ= 36 Σ= 106.63 Σ= 67.63 Σ= 182.62 Σ= 376.121 Σ= 246.881 Σ 958.6147
Solución del Ejemplo 1
clc;clear;n=6;
x=[1,1.2,1.5,2,3,3.7, 4,4.5]; y=[3,3.4,5,2,4.1,5,7,6.5];
plot(x,y);grid;
A=[n,sum(x),x*x' ,sum(y);
sum(x),x*x',sum(x.^3), x*y';
x*x', sum(x.^3), sum(x.^4), sum(x.^2*y')]
D=rref(A)
xi=5;
yi=D(1,4)+D(2,4)*xi+D(3,4)*xi^2
Ejecutando este Programa obtenemos
GRÁFICA DEL EJEMPLO 1
6.5
5.5
4.5
3.5
2.5
2
1 1.5 2 2.5 3 3.5 4 4.5
A=
8.00 20.90 67.63 36.00
20.90 67.63 246.88 106.63
67.63 246.88 958.61 376.12
D=
1.00 0.00 0.00 4.58
0.00 1.00 0.00 -1.52
0.00 0.00 1.00 0.46
yi = 8.51
Ejemplo 2.- Por regresión polinomial calcule y(0), si
x=1 1.2 1.5 2 3 3.7 4 4.5
y=3 3.4 5 2 4.1 5 7 8
Solución en Octave
clc;clear;n=8;
x=[1,1.2,1.5,2,3,3.7,4,4.5];
y=[3,3.4,5,2,4.1,5,7,8];
plot(x,y);grid;
A =[n,sum(x),x*x', sum(x.^3),sum(y);
sum(x),x*x',sum(x.^3), sum(x.^4),x*y';
x*x', sum(x.^3), sum(x.^4), sum(x.^5),x.^2*y';
sum(x.^3),sum(x.^4),sum(x.^5),sum(x.^6), x.^3*y']
D=rref(A)
xi=5;
yi=D(1,4)+D(2,4)*xi+D(3,4)*xi^2+D(4,4)*xi^3
Ejecutando este programa obtenemos
GRÁFICA DEL EJEMPLO 2
.
8
2
1 1.5 2 2.5 3 3.5 4 4.5
A=
8.00 20.90 67.63 246.88 37.50
20.90 67.63 246.88 958.61 113.38
67.63 246.88 958.61 3848.80 406.50
246.88 958.61 3848.80 15773.87 1582.72
D=
1.00 0.00 0.00 0.00 4.11
0.00 1.00 0.00 0.00 -0.47
0.00 0.00 1.00 0.00 -0.20
0.00 0.00 0.00 1.00 0.11
yi = 4.11
EJ 3.
x=[0 1 2 3 4 5 6];
Y=[0 0.9 1 0.2 -0.9 -1 -0.3];
Encontrar Y(1.5)
Y(4.5)
Y(5.5)
SOLUCION CON PROGRAMA DE OCTAVE
clc;clear;n=7;
x=[0 1 2 3 4 5 6];
y=[0 0.9 1 0.2 -0.9 -1 -0.3];
plot(x,y);grid;
A =[n,sum(x),x*x', sum(x.^3),sum(y);
sum(x),x*x',sum(x.^3), sum(x.^4),x*y';
x*x', sum(x.^3), sum(x.^4), sum(x.^5),x.^2*y';
sum(x.^3),sum(x.^4),sum(x.^5),sum(x.^6), x.^3*y']
D=rref(A)
xi=1.5;
yi=D(1,5)+D(2,5)*xi+D(3,5)*xi^2+D(4,5)*xi^3
RESULTADO DE EJECUCIÓN, Y(1.5)
A=
7.00 21.00 91.00 441.00 -0.10
21.00 91.00 441.00 2275.00 -6.90
91.00 441.00 2275.00 12201.00 -43.50
441.00 2275.00 12201.00 67171.00 -233.10
D=
1.00 0.00 0.00 0.00 -0.05
0.00 1.00 0.00 0.00 1.89
0.00 0.00 1.00 0.00 -0.91
0.00 0.00 0.00 1.00 0.10
x=[1960 1970 1980 1990 2000 2010];y=[4000 10000 20000 50000 90000 140000];
plot(x,y);grid;
x2=x.^2;xy=x.*y;x3=x.^3;x4=x.^4;Sx=sum(x);x2y=x2.*y;
Sy=sum(y);n=3;Sxy=sum(xy);
Sx2=sum(x2);Sx3=sum(x3);Sx4=sum(x4);Sx2y=sum(x2y);
A=[x y xy x2 x2y x3 x4];disp(A);
xm=Sx/n;Sy=sum(y);ym=Sy/n;S=[Sx,Sy,Sxy,Sx2,Sx2y, Sx3, Sx4];disp(S);
Si=[n Sx Sx2 Sy;Sx Sx2 Sx3 Sxy;Sx2 Sx3 Sx4 Sx2y];
xi=2020;
D=rref(Si);Pm=D(:,4);xi=2020;
yi=D(1,4)+D(2,4)*xi+D(3,4)*xi^2
4
x 10
14
12
10
0
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
IV. REGRESIÓN LINEAL MÚLTIPLE
IV. REGRESIÓN LINEAL MÚLTIPLE
EL MODELO
rs
a
ye
IV. REGRESIÓN LINEAL MÚLTIPLE
El modelo: Variables
Y = a+ X1 b1+…+ Xk bk +e
Variable
Dependiente
CUANTITATI Variables independiente
VA CUANTITATIVAS
O DUMMY
IV. REGRESIÓN LINEAL MÚLTIPLE
El modelo: parámetros
Y = a+ X1 b1+…+ Xk bk +e
Constante
Efecto de X en Y
(controlando por las demás
X)
IV. REGRESIÓN LINEAL MÚLTIPLE
ESTIMACIÓN DEL MODELO
Estimador Estimador del Coeficiente
de la del Modelo: Indica el
Constante efecto de X en Y
Y = a+ X1 b1+…+ Xk bk
Variable
Dependiente Variables
Predicha Independientes
NOTACIÓN MATRICIAL: Y =X*Β < --- > Y= X*B
Entonces la solución de mínimos cuadrados para la estimación de b o β que se ilustra en la sección Estimación de coeficientes,
"Regresión lineal múltiple" implica encontrar b para la que
SSE = (y - Xb)'(y - Xb)
se minimiza, al resolver para b en la ecuación
El resultado se reduce a la solución de b en
(X'X)b = X'y
Óxido nitroso, Humedad Temperatura Presión Óxido nitroso Humedad Temperatura Presión
y x1 x2 x3 y x1 x2 x3
0,90 72,4 76,3 29,18 1,07 23,2 76,8 29,38
0,91 41,6 70,3 29,35 0,94 47,4 86,6 29,35
0,96 34,3 77,1 29,24 1,10 31,5 76,9 29,63
0,89 35,1 68,0 29,27 1,10 10,6 86,3 29,56
1,00 10,7 79,0 29,78 1,10 11,2 86,0 29,48
1,10 12,9 67,4 29,39 0,91 73,3 76,3 29,40
1,15 8,3 66,8 29,69 0,87 75,4 77,9 29,28
1,03 20,1 76,9 29,48 0,78 96,6 78,7 29,29
0,77 72,2 77,7 29,09 0,82 107,4 86,8 29,03
1,07 24,0 67,7 29,60 0,95 54,9 70,9 29,37
.
El modelo es:
Y|x1, x2, x3 = b 0 + b 1 x1 + b 2 x2 +……..+ b 3 x3
Ajuste este modelo de regresión lineal múltiple a los datos dados
y después estime la cantidad de óxido nitroso para las
condiciones donde la humedad es 50%, la temperatura 76°F y
la presión barométrica 29,30.
SOLUCIÓN
.
.
Estime el modelo de regresión lineal múltiple para los datos dados y evalúe
la respuesta cuando x1=3, x2=6 y x3=9.
W X Y Z
25.5 1.74 5.30 10.80
31.2 6.32 5.42 9.40
25.9 6.22 8.41 7.20
38.4 10.52 4.63 8.50
18.4 1.19 11.60 9.40
26.7 1.22 5.85 9.90
26.4 4.10 6.62 8
25.9 6.32 8.72 9.10
32 4.08 4.42 8.70
25.2 4.15 7.60 9.20
39.7 10.15 4.83 9.40
35.7 1.72 3.12 7.60
26.5 1.70 5.30 8.20
SOLUCIÓN