Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Anlisis de Regresin
"Es un error capital el teorizar antes de poseer datos. Insensiblemente uno comienza a deformar los hechos para hacerlos encajar en las teoras, en lugar de encajar las teoras en los hechos".
By Sherlock Holmes.
Objetivos
1. Conocer la utilidad del anlisis de regresin para la solucin de problemas en ingeniera industrial y para reas afines. 2. Dominar las tcnicas de ajuste, validacin y uso del modelo de regresin. 3. Visualizar a la regresin como caso particular del problema de modelos lineales generalizados.
Temario
Introduccin I. Regresin lineal simple II. Regresin lineal mltiple III. Diagnstico del modelo de regresin IV. Construccin del modelo de regresin lineal V. Otros temas de inters
5.1 Modelos lineales generalizados 5.2 Transformacin de variables en regresin 5.3 Regresin logstica 5.4 Regresin no lineal
Evaluacin
Examen oral y escrito
Presentaciones de temas. Examen primer parcial (sesin 9 de noviembre 2012) Examen final (ultima sesin)
Introduccin
El anlisis de regresin es una coleccin de herramientas estadsticas para modelar e investigar la relacin entre dos o ms variables. Sus usos principales son: Predecir la respuesta en un nivel. Encontrar el nivel que optimiza respuesta.
la
Introduccin
La estadstica es la ciencia que le da significado a los datos. Busca extraer la informacin relevante en ellos, cual es la relacin (dependencia) de unas variables sobre otras.
Datos de regresin
Tradicionalmente las tablas de datos de regresin se organizan de la siguiente forma:
Tipos de regresin
Regresin simple: Cuando la variable Y depende nicamente de una nica variable X. Regresin mltiple: Cuando la variable Y depende de varias variables (X1, X2, ..., Xp) Regresin lineal: Cuando f(X) es una funcin lineal. Regresin no lineal: Cuando f(X) no es una funcin lineal.
lineal simple No lineal Regresin Lineal mltiple
No lineal
Ejemplos;
Muchas veces las decisiones se basan en la relacin entre dos o ms variables. Ejemplos: Dosis de fertilizantes aplicadas y rendimiento del cultivo. Relacin entre tamao de un lote de produccin y horas hombres utilizadas para realizarlo.
Grfico de dispersin
Los diagramas de dispersin no slo muestran la relacin existente entre variables, sino tambin resaltan las observaciones individuales que se desvan de la relacin general. Estas observaciones son conocidas como outliers o valores inusitados, que son puntos de los datos que aparecen separados del resto.
Y=f(X)
Ejemplo 1
Parcela 1 2 3 Dosis 75 25 130 Rend.(kg/h) 150 50 260
Rendimiento
200
150
Rend.
100
50
Dosis
Ejemplo 2
Lote de prod. 1 2 3 4 5 Tamao del lote 30 20 60 80 40 Horas hombre 73 50 128 170 87
160
120
100
80
60
Nota: La mayor parte de los punto no caen directamente sobre la lnea de relacin estadstica.
Esta dispersin de punto alrededor de la lnea representa la variacin aleatoria
Error aleatorio
Para profundizar en el modelo, suponer que se puede fijar el valor de X y observar el valor de la variable aleatoria Y. Si X esta fija el componente aleatorio e determina las propiedades de Y. El supuesto clsico de la regresin lineal es que e esta normalmente distribuido con una media=0 y
Nota: en esta figura se muestran las distribuciones de probabilidades de Y para distintos valores de X
21 20 19 18 17 16 15
Actividad 1
Simular una relacin probabilstica mediante un programa en matlab que reciba; una vector x, los parmetros a, b y la varianza del error aleatorio de la funcin y=a+b(x) + e, que genere: A) Un vector de variables dependientes y. B) Un grafico de dispersin x Vs y. C) La lnea de tendencia de la forma y=a+b(x) Suponga que el error aleatorio tiene una distribucin normal con media=0 Responda: Qu sucede con la nube de puntos cuando la variancia del error se incrementa?