Sei sulla pagina 1di 25

Anlisis de Regresin

Cuatrimestre septiembre-diciembre 2012

Anlisis de Regresin
"Es un error capital el teorizar antes de poseer datos. Insensiblemente uno comienza a deformar los hechos para hacerlos encajar en las teoras, en lugar de encajar las teoras en los hechos".
By Sherlock Holmes.

Mara de los Angeles Jimnez Duhart Mail: angeles_duhart777@hotmail.com

Objetivos
1. Conocer la utilidad del anlisis de regresin para la solucin de problemas en ingeniera industrial y para reas afines. 2. Dominar las tcnicas de ajuste, validacin y uso del modelo de regresin. 3. Visualizar a la regresin como caso particular del problema de modelos lineales generalizados.

Temario
Introduccin I. Regresin lineal simple II. Regresin lineal mltiple III. Diagnstico del modelo de regresin IV. Construccin del modelo de regresin lineal V. Otros temas de inters
5.1 Modelos lineales generalizados 5.2 Transformacin de variables en regresin 5.3 Regresin logstica 5.4 Regresin no lineal

Evaluacin
Examen oral y escrito
Presentaciones de temas. Examen primer parcial (sesin 9 de noviembre 2012) Examen final (ultima sesin)

Escala de evaluacin de 0-10 Mnimo aprobatorio 8

Software y bibliografa adicional


Matlab Minitab Statgraphics Birkes, D., & Dodge, D. Y. (2011). Alternative Methods of Regression. John Wiley & Sons. Douglas C. Montgomery, & George C. Runger. (s. f.). Probabilidad y estadstica aplicadas a la ingeniera (2a ed.). Mxico: LIMUSA. Pulido, H. G., Salazar, R. de la V., Carrasco, A. C., & Snchez, M. O. (2008). Anlisis y diseo de experimentos. Mc Graw-Hill.

Introduccin
El anlisis de regresin es una coleccin de herramientas estadsticas para modelar e investigar la relacin entre dos o ms variables. Sus usos principales son: Predecir la respuesta en un nivel. Encontrar el nivel que optimiza respuesta.

la

Introduccin
La estadstica es la ciencia que le da significado a los datos. Busca extraer la informacin relevante en ellos, cual es la relacin (dependencia) de unas variables sobre otras.

Datos de regresin
Tradicionalmente las tablas de datos de regresin se organizan de la siguiente forma:

Tipos de regresin
Regresin simple: Cuando la variable Y depende nicamente de una nica variable X. Regresin mltiple: Cuando la variable Y depende de varias variables (X1, X2, ..., Xp) Regresin lineal: Cuando f(X) es una funcin lineal. Regresin no lineal: Cuando f(X) no es una funcin lineal.
lineal simple No lineal Regresin Lineal mltiple

No lineal

Ejemplos;
Muchas veces las decisiones se basan en la relacin entre dos o ms variables. Ejemplos: Dosis de fertilizantes aplicadas y rendimiento del cultivo. Relacin entre tamao de un lote de produccin y horas hombres utilizadas para realizarlo.

Notas sobre los modelos


En el anlisis de regresin trabajamos con modelos probabilsticos y no funcionales. En algunas ocasiones los modelos surgen de una relacin terica, en otros no se contara con conocimiento de la relacin entre X y Y, y la eleccin del modelo se basar en la inspeccin del diagrama de dispersin, por lo tanto el modelo se considera un modelo emprico.

Grfico de dispersin
Los diagramas de dispersin no slo muestran la relacin existente entre variables, sino tambin resaltan las observaciones individuales que se desvan de la relacin general. Estas observaciones son conocidas como outliers o valores inusitados, que son puntos de los datos que aparecen separados del resto.

Relacin funcional entre dos variables


Una relacin funcional se expresa mediante una funcin matemtica. Si X es la variable independiente e Y es la variable dependiente, una relacin funcional tiene la forma:

Y=f(X)
Ejemplo 1
Parcela 1 2 3 Dosis 75 25 130 Rend.(kg/h) 150 50 260

Relacin funcional perfecta entre dosis y rendimientos


300 250

Rendimiento

200

150

Rend.

100

50

0 0 20 40 60 80 100 120 140

Dosis

Nota: Las observaciones caen exactamente sobre la lnea de relacin funcional

Relacin estadstica entre dos variables


A diferencia de la relacin funcional, no es una relacin perfecta, las observaciones no caen exactamente sobre la curva de relacin entre las variables

Introducimos a la ecuacin un termino de error aleatorio


Y=f(X) +

Ejemplo 2
Lote de prod. 1 2 3 4 5 Tamao del lote 30 20 60 80 40 Horas hombre 73 50 128 170 87

Diagrama de dispersin Tamao lote Vs Horas hombre


180

160

140 Horas hombre

120

100

80

60

40 18 28 38 48 58 Tamao del lote 68 78 88

Nota: La mayor parte de los punto no caen directamente sobre la lnea de relacin estadstica.
Esta dispersin de punto alrededor de la lnea representa la variacin aleatoria

Error aleatorio
Para profundizar en el modelo, suponer que se puede fijar el valor de X y observar el valor de la variable aleatoria Y. Si X esta fija el componente aleatorio e determina las propiedades de Y. El supuesto clsico de la regresin lineal es que e esta normalmente distribuido con una media=0 y

Representacin grfica del modelo de Regresin Lineal

Nota: en esta figura se muestran las distribuciones de probabilidades de Y para distintos valores de X

Origen del concepto


El trmino regresin fue introducido por Francis Galton en el documento tipicas leyes de la herencia(1877) y fue confirmado por Karl Pearson. Su trabajo se centr en la descripcin de los rasgos fsicos de los descendientes (v.dep) a partir de los de sus padres (v. ind). "ley de la regresin universal": Cada peculiaridad en un padre es compartida por sus descendientes, pero en media, en un grado menor. Nota: originalmente la llamo reversin (1877) y posteriormente la cambio a regresin (1885).

Experimento de Francis Galton


dimetro guisantes padres dimetro medio guisantes descendientes

diametro promedio gisantes descendientes


diametro promedio guisantes descendientes 18.0 17.5 17.0 16.5 16.0 15.5 15.0 14 16 18 20 Diametro guisantes padres 22 diametro promedio gisantes descendientes Linear (diametro promedio gisantes descendientes) y = 0.3429x + 10.114 R = 0.8011

21 20 19 18 17 16 15

17.5 17.3 16.0 16.3 15.6 16.0 15.3

Modelos simples Vs modelos complejos


Un buen modelo de regresin debe ser lo suficientemente aproximado al fenmeno real para describirlo y tan simple como sea posible para que sea comprensible. El modelo mas sencillo es el modelo de regresin lineal simple. En los modelos mltiples habr que considerar la significancia de las variables explicativas para ver la conveniencia de reducirlas cuando no tengan peso sobre el modelo

Actividad 1
Simular una relacin probabilstica mediante un programa en matlab que reciba; una vector x, los parmetros a, b y la varianza del error aleatorio de la funcin y=a+b(x) + e, que genere: A) Un vector de variables dependientes y. B) Un grafico de dispersin x Vs y. C) La lnea de tendencia de la forma y=a+b(x) Suponga que el error aleatorio tiene una distribucin normal con media=0 Responda: Qu sucede con la nube de puntos cuando la variancia del error se incrementa?

Mtodos Alternativos de Regresin


Temas primera presentacin: Regresin de la mnima desviacin absoluta LAD (21 septiembre-Blanca Tovar) . M-Regresin (28 de septiembre) Regresin no paramtrica (5 de octubre-Javier Cruz) Regresin Bayesiana (12 de octubre)

Potrebbero piacerti anche