Sei sulla pagina 1di 11

REGRESION

Introduccin. Regresin es una palabra un tanto rara. La utilizan los bilogos, los mdicos, los psiclogos... y suena como "ir hacia atrs", "volver al pasado", y realmente este es verdadero significado del vocablo. Fue un bilogo y estadstico ingls, SIR FRANCIS GALTON*, quien introdujo en 1889 el trmino regresin en Estadstica. Emple este concepto para indicar la relacinque exista entre la estatura de los nios de una muestra y la estatura de su padre. Observ, que si los padres son altos, los hijos generalmente tambin lo son, y si lospadres son bajos los hijos son tambin de menor estatura. Pero ocurra un hechocurioso: cuando el padre es muy alto o muy bajo, aparece una perceptible "regresin", hacia la estatura media de la poblacin, de modo que sus hijos retroceden hacia lamedia de la que sus padres, por cierto, estn muy alejados. Hoy da, el trmino no seutiliza en ese sentido. Concepto El anlisis de regresin consiste en emplear mtodos que permitan determinar la mejor relacin funcional entre dos o ms variables concomitantes (o relacionadas). En muchas ocasiones, se desea conocer algo acerca de la relacin o dependenciaentre dos caractersticas cuantitativas, o msde una, consideradas sobre la mismapoblacin objeto de estudio (por ejemplo la talla y el peso). Hay muchos casos en losque ya de antemano se "sospecha" que puede existir algn tipo de relacin, y porconsiguiente, se pretende saber por ejemplo, en el caso de que tengamos nicamente dosvariables: 1.- Si ambas variables estn realmente relacionadas entre s o si, por elcontrario, pueden considerarse independientes. 2.- Si existe dependencia, es necesario conocer el "grado de relacin", ascomo el "tipo" de relacin entre ambas. 3.- Si puede predecirse la variable que es considerada como dependiente apartir de los valores de la otra, que es considerada independiente, y si es as,con qu precisin. Cundo existe regresin? De una forma general, lo primero que suele hacerse para ver si dos variablesaleatorias estn relacionadas o no (de ahora en adelante las llamaremos X e

Y,denotando con Y a la variable dependiente, y X a la variable independiente o regresora),consiste en tomar una muestra aleatoria. Sobre cada individuo de la muestra se analizanlas dos caractersticas en estudio, de modo que para cada individuo tenemos un par devalores (xi, yi) (i=1,...,n). Seguidamente, representamos dichos valores en unos ejes cartesianos, dando lugaral diagrama conocido como diagrama de dispersin o nube de puntos. As, cadaindividuo vendr representado por un punto en el grfico, de coordenadas, xi, yi.De esa forma, podremos obtener una primera idea acerca de la forma y de ladispersin de la nube de puntos. Al dibujar la nube de puntos, podemos encontrarnos, entre otros, los casos a losque hace referencia la figura 6.1. En primer lugar deberemos distinguir entre dependencia funcional ydependencia estocstica. En el primer caso la relacin es perfecta: Y=f(X) (ver figura6.1d y e); es decir, los puntos del diagrama de dispersin correspondiente, aparecensobre la funcin Y=f(X). Por ejemplo, el caso de la figura 6.1d sera Y=a+bX.Sin embargo, lo que suele ocurrir es que no existe una dependencia funcionalperfecta, sino otra dependencia o relacin menos rigurosa que se denomina dependenciaestocstica (figura 6.1b y c); entonces, la relacin entre X e Y, podramos escribirla (enel caso de la figura 6.1.b) de la forma Y=a+bX+e, donde e es un error o un residual,debido por ejemplo, a no incluir variables en el modelo que sean importantes a la horade explicar el comportamiento de Y, y cuyos efectos sean diferentes a los de X; erroresaleatorios o de medida, o simplemente a que estamos especificando mal el modelo (porejemplo, que en lugar de ser una recta, sea una parbola).4 Figura 6.1: Tipos de relacin entre dos variables X e Y

El caso de la figura 6.1a se corresponde con el de ausencia de relacin, o independencia. Formulacin: Problemas de Aplicacin (Formulacin): Diagrama de Dispersin.- Es una grfica en el eje cartesiano en la que cada punto trazado representa los valores de las variables (X,Y) y el cual nos permite encontrar la curva de mejor ajuste por los distintos mtodos de aproximacin comoser: y y y y Mtodo de mano alzada. Mtodo libre. Mtodo semipromedio. Mtodo de los mnimos cuadrados.

Ejemplo.- Sean los Gastos de publicidad en los meses enero a julio, los cuales generan los siguientes ingresos:

a) Mtodo de Mano alzada (Mtodo Grfico).- Consiste en utilizar como referencia el diagrama de dispersin e identificar la funcin de acuerdo a la tendencia de los puntos de la grfica. Observacin.- En la grfica podemos identificar las desviaciones de los puntos con respecto a la recta. La desventaja de este mtodo consiste en la dependencia existente entre ambas variables ya que si aumentan los valores de X, tambin lo harn los valores de Y.

b) Mtodo Libre.- Consiste en ajustar una recta a una curva de tendencia mediante la observacin del grfico. Los puntos que servirn de base para establecer la funcin deseada sern escogidos por el observador. Mediante el diagrama de dispersin observamos que se trata de una funcin lineal (Por la forma de los puntos de "X,Y").

C)Mtodo Semipromedio.- Consiste en agrupar los datos en dos estratos preferiblemente iguales y lograr dos puntos en el grfico para trazar una recta de tendencia. Este mtodo nos permite trazar funciones lineales para cada semipromedio y luego resolver mediante el sistema lineal deseado.

d) Mtodo de los Mnimos Cuadrados.- Al realizar un anlisis lgico entre las variables es necesario determinar el tipo de funcin matemtica que representa la relacin entre ellas, para lo cual se debe ajustar la recta o curva de regresin en base a la forma que representa la grfica. La curva de mejor ajuste se la puede realizar por el mtodo de los mnimos cuadrados aplicando a diferentes tipos de funciones tal como ser: Funcin Lineal, Parablica, Potencial, Exponencial, etc. d.1)Funcin Lineal o Recta de Regresin de los Mnimos Cuadrados.- Si al observar el diagrama de dispersin notamos un comportamiento rectilneo, el ajuste de la recta de regresin de los mnimos cuadrados se lo realiza de la forma siguiente:

d.2) Funcin Parablica de Regresin de los Mnimos Cuadrados.-Las relaciones lineales se la pueden adaptar a diferentes tipos de curva. El ajuste correspondiente se lo realiza de la siguiente forma:

d.3) Funcin Potencial.- Es muy utilizada en proyecciones, por su flexibilidad se la conoce como funcin de elasticidad por lo que es muy sensible al comportamiento en el diagrama de dispersin. Su expresin matemtica es la siguiente:

d.4) Funcin Exponencial.- Cuando se desea calcular tasas de crecimiento, tomando en cuenta los puntos observados en el perodo histrico, se recurre a la siguiente funcin:

CORRELACION
Introduccin. Una de las principales dificultades que nos presenta la regresin es la confiabilidad en la funcin utilizada, para lo cual recurrimos a otro tipo de anlisis denominado mtodo de Correlacin. Concepto: Determina el grado de relacin existente entre las variables y el efecto producido por el cambio de una variable con respecto de la otra.

Tipos de Correlacin.-El tipo de Correlacin debe ser analizado en el diagrama de dispersin en base a la forma que toma la curva de la funcin y a la relacin entre las variables. Cuando el anlisis se basa en el estudio de dos variables se denomina Correlacin simple, cuando se analizan ms variablesse las denomina Correlacin mltiple.

Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la correlacin tiende a ser lineal directa (mayores valores de X significan mayores valores de Y), y se aproxima a 1 cuando la correlacin tiende a ser lineal inversa. Es importante notar que la existencia de correlacin entre variables no implica causalidad. Nota: Si no hay correlacin de ningn tipo entre dos variables aleatorias, entonces tampoco habr correlacin lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 slo nos dice que no hay correlacin lineal, pero puede que la haya de otro tipo. El siguiente diagrama resume el anlisis del coeficiente de correlacin entredos variables:

Problemas de Aplicacin (Formulacin): Medidas de Correlacin.- Se utiliza para determinar el grado de Correlacin existente entre las variables observadas, mediante los siguientes indicadores: a) Varianza General.- Es utilizada para la determinacin del coeficiente de Correlacin y se obtiene sumando la varianza no explicada con la varianza explicada.

b) Coeficiente de Determinacin.- Es el cociente de la variacin explicada y la variacin general y es de gran utilidad para la determinacin del coeficiente de Correlacin. Su expresin matemtica est dada por:

c) Coeficiente de Correlacin.- Es la raz cuadrada del cociente de los valores calculados y los valores estimados. Su valor est comprendido entre (-1) y (+1) determinando la correlacin positiva o negativa; el valor cero significa que existe una gran correlacin entre la variables.

d) Error tpico de la Estima.- Es la sumatoria de los desvoscuadrticos de las variables observadas y estimadas. El errortpico tiene propiedades anlogas a las de la desviacin tpica ya que poseen similar expresin matemtica.

e) Margen de Seguridad (Intervalos de Confianza).- Nos ayuda a determinar el grado de confianza en la utilizacin de una funcin determinada y se calcula sumando y restando a los valores mximos y mnimos de (Y*), el valor del error tpico de la estima, con lo cual se obtienen dos lneas paralelas.

f) Margen de Error y Margen de Confianza.- Se denomina margen de error al cociente de dividir los valores del nmero de observaciones que han quedado fuera del margen de seguridad entre el nmero total de observaciones. Margen de confianza es el cociente entre las observaciones que han quedado dentro del margen de seguridad y el nmero total de observaciones. El margen de confianza debe ser superior al 60% para quetengamos la seguridad que utilizamos una curva de mejor ajuste de regresin. Si el margen de seguridad no fuese superior al 60% la curva de regresin debe ser ajustada a otro tipo de funcin. Ambos mrgenes deben ser expresados en trminos porcentuales y la suma deambos debe dar como resultado el 100%

Interpretacin.- Existe un 71,43% de confianza que la funcinlineal de regresin de los mnimos cuadrados Y= 11,36X-2,22 es la ms confiable, al cumplir con la siguiente condicin: MC > 60% Conclusin En conclusin la Regresin y la Correlacin son dos medidas que estn estrechamente relacionadas pero son totalmente diferentes, puesto que la Correlacin es la medida en la cual se relacionan dos variables diferentes, mientras que la Regresin es la ecuacin matemtica que describe el comportamiento de dos medidas, es decir, con la regresin podemos construir una frmula que nos exprese el comportamiento entre las variables. Bibliografa: http://www.sc.ehu.es/sbweb/fisica/cursoJava/numerico/regresion/regresion.htm
http://www.upcomillas.es/personal/peter/investigacion/Regresion.pdf

UNIVERSIDAD DE CUENCA

FACULTAD DE CIENCIAS QUIMICAS ESCUELA DE INGENIERIA INDUSTRIAL

MATERIA: ESTADISTICA II

TEMA: TRABAJO DE INVESTIGACION REGRESION Y CORRELACION

INTEGRANTES: MARCELA ESPINOSA JOSE MIGUEL NEIRA

FECHA: 22 de junio de 2011

Potrebbero piacerti anche