Sei sulla pagina 1di 17

Anlisis de Regresin Logartmica

UNIVERSIDAD DE SAN CARLOS


FACULTAD DE INGENIERIA
DEPARTAMENTO DE ESTADISTICA

ANALISIS DE REGRESION SIMPLE LOGARITMICA


Ing. Agr. Luis Manfredo Reyes Chvez
Profesor Titular Departamento de Estadstica

1. INTRODUCCION:
Este modelo de regresin es una alternativa cuando el modelo lineal no logra un coeficiente de
determinacin apropiado, o cuando el fenmeno en estudio tiene un comportamiento que puede
considerarse potencial o logartmico. La forma ms simple de tratar de establecer la tendencia es a
travs de un diagrama de dispersin o nube de puntos, tal como la siguiente:

Este modelo tambin es conocido como potencial, Cobb-Douglas de primer grado o exponencial
inverso.
2. Ecuacin caracterstica
La funcin que define el modelo es la siguiente:

Yi=A*XBi* E
En la cual:
Yi : Variable dependiente, isima observacin
A, B: Parmetros de la ecuacin, que generalmente son
desconocidos
E: Error asociado al modelo
Xi : Valor de la -esima observacin de la variable
independiente
Al sustituir los parmetros por estimadores, el modelo adopta la siguiente forma:

yi=a*xbi
la ecuacin se transforma aplicando logaritmos de ambos lados, con lo cual se convierte a una
forma lineal:
Ln yi= Ln a +b*Ln xi
3. Tabla de datos
Para el ajuste de un conjunto de datos al modelo geomtrico de regresin, se construye la
siguiente tabla de datos:

X Y Ln x Ln y (ln x)2 (ln y)2 Ln X*ln y

.. .. .. .. .. ..

ln ln (ln x)2 (lny) Lnx*lny


2
x y

Debido a las propiedades de los logaritmos, ningn valor de x ni de y puede ser negativo. En tal
caso, lo que se hace es definir un valor de x o de y muy pequeo (Ej: 0.00000001)
Se puede trabajar con logaritmos naturales o logaritmos base 10.

4. Estimadores del modelo


los estimadores para el ajuste del modelo se calculan de la siguiente manera

Ser necesario utilizar antilogaritmos para obtener el valor final de a

5. Anlisis de varianza para la regresin


Con el objeto de determinar si el modelo explica o no el fenmeno en estudio, se realiza el anlisis
de varianza, que se calcula de la siguiente manera

Fuente de Grados de Suma de cuadrados Cuadrado F calculada F


Variacin libertad medio tabulad
a
Regresin 1 b* (Lnxlny- S.C. Reg/1 C.M.Reg/C.M.Err
(Lnx)*(lny)/n) or
Error n-2 S.C. Total- S.C. S.C. Error/(n-
Regresin 2)
Total n-1 (lny)2-(lny)2 /n n-1

Ho: El modelo no explica el fenmeno en estudio


Ha: El modelo s explica el fenmeno en estudio

Para buscar en la tabla la F tabulada, se usan el el numerador los grados de libertad de


regresin y en el denominador, de acuerdo al nivel de significancia escogido (los ms usuales son
al 5% y al 1%)
Si el valor de F calculada es mayor que el de F tabulada, se rechaza Ho, en caso contrario
se acepta

6. Grado de ajuste del modelo


Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinacin, de la
siguiente manera

El valor de r2 tiene un rango entre 0 y 1. No puede obtenerse valores negativos

7. Pruebas de Hiptesis para el modelo

7.1 Para el coeficiente b


Para probar la hiptesis de que el coeficiente b es igual a un valor b, ser igual a cero, se procede
de la siguiente manera:

i) Se plantea la hiptesis Ho:b=b y la alternativa Ha: b b


ii) Se calcula el estadstico :

Sb es conocido como el error standard de b y se calcula de la siguiente manera:

El cuadrado medio del error se obtiene del anlisis de varianza.

iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:
n-2 grados de libertad y un nivel /2

iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso


contrario, se acepta .

7.2 Para el coeficiente a


Se puede probar la hiptesis de que el coeficiente a es igual a un valor a, para lo
cual se sigue el siguiente procedimiento:

i) Se define la hiptesis: Ho: a=a y la alternativa Ha: aa


ii) Se calcula el error standard para a con la siguiente frmula:

El cuadrado medio del error se obtiene del anlisis de varianza


iii) Se calcula el estadstico de prueba:

iv) Se obtiene en la tabla de t de student el estadstico comparador, con los siguientes datos: n-2 grados
de libertad y nivel /2
v) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la hiptesis
se acepta

8. Intervalos de confianza

8.1 Para el coeficiente b


El intervalo de confianza para el coeficiente b se calcula as:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un
nivel /2

8.2 Para el coeficiente a


El intervalo de confianza para el coeficiente a se calcula as:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un
nivel /2

8.3 para la media de y


Un intervalo de confianza para la respuesta media de y, dado x 0 sera:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un
nivel /2
El valor de xm que aparece en la frmula es el promedio de valores de los logaritmos de x

8.4 para la estimacin de y


El intervalo de confianza para la estimacin de y, dado un valor de x 0 se obtiene de la siguiente
manera:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-2 grados de libertad y un
nivel /2
El valor de xm que aparece en la frmula es el promedio de valores de x

9. Clculo de estimadores, coeficiente de determinacin y anlisis de varianza mediante el uso de


matrices
Un mtodo alternativo para realizar los clculos, es el uso de matrices. En este caso, el
procedimiento es el siguiente:

i) formar la matriz x: (matriz de variable independiente), agregando la primera columna formada por
unos:

1 Ln x1
1 Ln x2
... .....
1 Ln xn

ii) Formar el vector de logaritmos de y

Ln y1
Ln y2
.....
Ln yn

iii) Formar la matriz x transpuesta ( x)

1 1 ... 1
Ln x1 Ln x2 ... Ln xn

iv) Calcular el producto matricial xx


V) Calcular la inversa del producto [ o sea (xx)-1]
vi) Calcular el producto xy
vii) Calcular el producto (xx)-1*(xy)=b
El resultado de esta operacin es el vector de coeficientes de regresin (el primero es el logaritmo
de a y el segundo es b). El valor de b sale directamente, mientras que el de a est en forma
logartmica, de modo que para formar la ecuacin original se obtiene el antilogaritmo.
viii) Para el clculo del anlisis de varianza, se tienen las siguientes operaciones
matriciales:

Fuente de Grados de Suma de cuadrados Cuadrado F calculada F


Variacin libertad medio tabulad
a
Regresin 1 b( x )(y)-ny m
2 S.C. Reg/1 C.M.Reg/C.M.Err *
or
Error n-2 yy-b( x )(y) S.C. Error/(n-
2)
Total n-1 yy- nym2 n-1

El valor de ym que aparece en las frmulas es el promedio de los logaritmos de y

ix) Finalmente, el coeficiente de determinacin por matrices se obtiene de la


siguiente manera:

r2= {b(x)(y)- nym2}/(yy- nym2)


10. Por fin un ejemplo!
Se realiz un estudio comparativo del nivel de ruido (en decibeles) producido por discotecas
rodantes, se procedi a evaluar diferentes niveles de potencia (en vatios). Los datos finales fueron:

POTENCI DECIBELES
A
100 60
500 80
1000 90
5000 99
10000 120

En base a los datos anteriores:


a) Construya un diagrama de dispersin
b) Efecte la estimacin del modelo logartmico
c) Determine el grado de ajuste e interprtelo
d) Elabore el anlisis de varianza y disctalo
e) Qu lectura se obtendra con un potencia de 3000 vatios?
f) Pruebe la hiptesis que b=1 con un 99% de confianza
g) Calcule intervalo de confianza al 95% para a y b
h) Efecte la estimacin del modelo, el andeva y obtenga el coeficiente de determinacin por medio de
matrices.

a) Diagrama de Dispersin
El diagrama de dispersin muestra una tendencia logartmica, pues aunque hay incrementos
fuertes de potencia, los niveles de ruido no crecen excesivamente.

b) Estimadores del modelo

i) Tabla de Datos:

x y Ln x Ln y (ln x)2 (ln y)2 Lnx*Lny


100 60 4.6052 4.0943 21.2076 16.7637 18.8552
500 80 6.2146 4.3820 38.6214 19.2022 27.2326
1000 90 6.9078 4.4998 47.7171 20.2483 31.0836
5000 99 8.5172 4.5951 72.5426 21.1151 39.1375
10000 120 9.2103 4.7875 84.8304 22.9201 44.0944
SUMAS: 35.4551 22.3588 264.9190 100.2493 160.4033

ii) Estimadores del modelo

c) Grado de ajuste del modelo


El coeficiente de determinacin se calcula as:

Se puede concluir que el grado de ajuste del modelo es alto, por lo que el modelo es confiable para
hacer predicciones.

d) Anlisis de varianza del modelo


iii) Suma de cuadrados del error : 0.2661-0.255= 0.0111
iv) Grados de libertad de regresion=1
v) Grados de libertad totales= 5-1=4
vi) Grados de libertad del error=5-2=3
vii) Cuadrado medio de regresin= 0.255/1=0.255
viii) Cuadrado medio del error= 0.0111/3=0.0037
ix) F Calculada=0.255/0.0037=68.91
x) F Tabulada (1,3,0.01)= 34.12
xi) Tabla de Andeva:

Fuente de Grados de Suma de cuadrados Cuadrado F F


Variacin libertad medio calculad tabulada
a
Regresin 1 0.2550 0.255 68.91 34.12*
Error 4 0.0111 0.0037
Total 5 0.2661

Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha, con lo cual
se concluye que el modelo s explica el fenmeno en estudio y que los resultados obtenidos no se
deben a la casualidad.

e) Qu lectura en decibeles se obtiene al aplicar una potencia de 3,000 vatios?


Para esto, simplemente se utiliza la ecuacin anteriormente encontrada por estimacin,
sustituyendo el valor de x por 3,000

y= 33.164*(3000)0.1374=99.63
se puede aplicar la operacin equivalente por medio de los logaritmos de los estimadores:

LN Y= 3.497+0.1374*LN(3,000)=4.59707

Finalmente, y=e4.59707=99.63
f) Pruebe la hiptesis de que b=1 con un 99% de confianza
Inicialmente se plantea Ho: b=1 y su alterna Ha: b1
A continuacin se obtiene el error standard de b:
El valor de t de student de calcula de la siguiente manera: (el logaritmo de 1 es cero)

El valor de t se obtiene en la tabla de t de student, con 5-2=3 grados de libertad y (1-.99)/2=0.005


de , siendo el valor igual a 5.841

Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el coeficiente
b no es igual a 1.

g) Calcule intervalos de confianza al 95% para a y b


El valor de t de student al 95% con 3 grados de libertad es= 3.182
Intervalo de confianza para b:

El intervalo final ser entonces el siguiente: -0.3892< B< 0.664

Intervalo de confianza para a:

El intervalo final para el logaritmo de a sera: 3.1137< Ln A <3.8803

i) Ajuste del modelo y anlisis de varianza mediante matrices:

Matriz x: Matriz x transpuesta ( x )


1 1 1 1 1
4.605 6.214 6.907 8.517 9.210
2 6 8 2 3

Vector y: 4.09430
4.3820
4.4998
4.5595
4.7875

Producto xx:

5 35.4551
35.455 264.919
1 1

Matriz inversa de xx:

3.9228 -0.5250
-0.5250 0.07403

Producto x y

22.8231
163.5535

Producto Final b=(xx)-1* (x y)

3.6644
0.1269

Anlisis de varianza
Suma de cuadrados de regresin= bxy- nym2= 0.255
ym= 22.3588/5=4.47176

Suma de cuadrados total=yy- nym2=0.2661

4.09430
4.3820
(4.0943 4.382 4.4998 4.5595 4.7875) 4.4998 -5(4.47176)2= 0.2661
4.5595
4.7875

Suma de cuadrados del error =: 0.2661-0.255=0.0111


Grados de libertad de regresion=1
Grados de libertad totales= 5-1=4
Grados de libertad del error=5-2=3
Cuadrado medio de regresin= 0.255/1=0.255
Cuadrado medio del error= 0.0111/3=0.0037
F Calculada=0.255/0.0037=68.91
F Tabulada (1,3,0.01)= 34.12

Anlisis de Varianza Final:

Fuente de Grados de Suma de cuadrados Cuadrado F F


Variacin libertad medio calculad tabulada
a
Regresin 1 0.255 0.255 68.91 34.12*
Error 3 0.0111 0.0037
Total 4 0.2661

REGRESION CUADRATICA

Aqu se describe como hacer una regresin para ajustar a una parbola de
segundo grado
La regresin cuadrtica es el proceso por el cul encontramos los
parmetros de una parbola que mejor se ajusten a una serie de datos que
poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habramos
de querer ajustar nuestros datos precisamente a una parbola y no a otra funcin? (ver
escogiendo la funcin de ajuste).

Una funcin cuadrtica o de segundo grado se puede representar de manera


genrica como :

Entonces lo que nos interesa es encontrar los valores de a, b y c que hacen que el
valor de y calculado sea lo mas cercano posible al medido.
Deduccin de las Ecuaciones:

De nuevo hacemos una definicin de la funcin de error, y encontramos los valores


de los parmetros que la minimizan, tomando derivadas parciales de la funcin por
cada parmetro que haya:
Una vez se haya reemplazado el valor de n, y de las sumatorias, slo habr que
solucionar el sistema de ecuaciones por su mtodo preferido, Eliminacin Gaussiana,
Krammer, etc. Despus de que ha solucionado el sistema de ecuaciones entonces
tendr el valor de los parmetros: a,b,c.

Ejemplo:

En determinado proceso se realizaron una serie de 24 mediciones, que luego al


graficarse se determin que es de naturaleza cuadrtica. Se desea encontrar los
parmetros del polinomio de segundo grado, que mejor se ajusta a esa serie de datos,
y cul es el valor de la variable dependiente, cuando el valor de la variable
independiente es de 20.

La tabla con los datos medidos es la siguiente:

X Y
0 10,08
0,5 12,03
1 11,38
1,5 18,81
2 20,53
2,5 28,50
3 31,38
3,5 38,40
4 48,39
4,5 60,60
5 66,66
5,5 82,61
6 91,37
6,5 105,44
7 122,53
7,5 137,77
8 152,74
8,5 172,65
9 188,84
9,5 207,77
10 230,94
10,5 251,35
11 274,07
11,5 295,95

Ahora, teniendo en cuenta la matriz que dedujimos anteriormente, sabemos que


tenemos que encontrar los valores de la suma de x, la suma de x2, de x3, x4, de Yi,
xYi, x2*Yi y n=24.

X Y X^2 X^3 X^4 Xyi X^2Yi


0 10,08 0,00 0,00 0,00 0,00 0,00
0,5 12,03 0,25 0,13 0,06 6,01 3,01
1 11,38 1,00 1,00 1,00 11,38 11,38
1,5 18,81 2,25 3,38 5,06 28,21 42,31
2 20,53 4,00 8,00 16,00 41,06 82,13
2,5 28,50 6,25 15,63 39,06 71,24 178,11
3 31,38 9,00 27,00 81,00 94,14 282,41
3,5 38,40 12,25 42,88 150,06 134,39 470,36
4 48,39 16,00 64,00 256,00 193,56 774,26
4,5 60,60 20,25 91,13 410,06 272,68 1227,08
5 66,66 25,00 125,00 625,00 333,31 1666,55
5,5 82,61 30,25 166,38 915,06 454,37 2499,02
6 91,37 36,00 216,00 1296,00 548,23 3289,38
6,5 105,44 42,25 274,63 1785,06 685,39 4455,05
7 122,53 49,00 343,00 2401,00 857,74 6004,20
7,5 137,77 56,25 421,88 3164,06 1033,24 7749,32
8 152,74 64,00 512,00 4096,00 1221,90 9775,23
8,5 172,65 72,25 614,13 5220,06 1467,54 12474,08
9 188,84 81,00 729,00 6561,00 1699,55 15295,92
9,5 207,77 90,25 857,38 8145,06 1973,80 18751,13
10 230,94 100,00 1000,00 10000,00 2309,40 23093,97
10,5 251,35 110,25 1157,63 12155,06 2639,18 27711,38
11 274,07 121,00 1331,00 14641,00 3014,81 33162,86
11,5 295,95 132,25 1520,88 17490,06 3403,37 39138,76
266,078,16
Total 138 1081 9522 89452,75 22494,51 208137,88
6

Reemplacemos los valores en la matriz...

Aqu tenemos la matriz, resolviendo, por Gauss Jordan


24 138 1081 2660,8
138 1081 9522 22495
1081 9522 89453 208138

1 5,75 45,04 110,86


0 287,5 3306,25 7195,4
0 3306,25 40762,95 88291,13

1 0 -21,08 -33,04
0 1 11,5 25,02
0 0 2741,08 5544,03

1 0 0 9,60
0 1 0 1,76
0 0 1 2,02

Por lo tanto: a=9.6 b=1.76 c=2.02

la parbola de mejor ajuste es entonces:

- See more at: http://www.ingenieria-industrial.net/index.php?


accion=1&id=83#sthash.Su4n1Wzp.dpuf

Potrebbero piacerti anche