Sei sulla pagina 1di 11

1.

RESUMEN

En esta monografa hemos aprendido que el anlisis de regresin lineal es una tcnica
estadstica que permite estudiar la relacin entre una variable dependiente (VD) y una
o ms variables independientes (VI) con el doble propsito de: averiguar en qu
medida la DV puede estar explicada por la(s) (VI) y obtener predicciones en la VD a
partir de las VI. El procedimiento implica, bsicamente, obtener la ecuacin minimo-
cuadratica que mejor expresa la relacin entre la VD y las VI y estimar mediante el
coeficiente de determinacin la calidad de la ecuacin de regresin obtenida. Estos
dos pasos deben ir acompaados de un chequeo del cumplimiento de las condiciones
o supuestos que garantizan la validez del procedimiento.
2. INTRODUCCION

Todo proceso productivo es un sistema formado por personas, equipos


y procedimientos de trabajo. El proceso genera una salida (output), que es
el producto que se quiere fabricar. La calidad del producto fabricado est determinada
por sus caractersticas de calidad, es decir, por sus propiedades fsicas, qumicas,
mecnicas, estticas, durabilidad, funcionamiento, etc. que en conjunto determinan el
aspecto y el comportamiento del mismo. El cliente quedar satisfecho con el producto
si esas caractersticas se ajustan a lo que esperaba, es decir, a sus expectativas previas.
Por lo general, existen algunas caractersticas que son crticas para establecer la calidad
del producto. Normalmente se realizan mediciones de estas caractersticas y se
obtienen datos numricos. Si se mide cualquier caracterstica de calidad de un
producto, se observar que los valores numricos presentan una fluctuacin o
variabilidad entre las distintas unidades del producto fabricado. Por ejemplo, si la
salida del proceso son frascos de mayonesa y la caracterstica de calidad fuera el peso
del frasco y su contenido, veramos que a medida que se fabrica el producto las
mediciones de peso varan al azar, aunque mantenindose cerca de un valor central.

El peso de los frascos llenos flucta alrededor de los 250 grs. Si la caracterstica de
calidad fuera otra, como el contenido de aceite, el color de la mayonesa o el aspecto
de la etiqueta tambin observaramos que las sucesivas mediciones fluctan alrededor
de un valor central.
El valor de una caracterstica de calidad es un resultado que depende de una
combinacin de variables y factores que condicionan el proceso productivo. Por
ejemplo, en el caso de la produccin de mayonesa es necesario establecer que
cantidades de aceite, huevos y otras materias primas se van a usar. Hay que establecer
a qu velocidad se va a agitar la mezcla y cunto tiempo. Se debe fijar el tipo y tamao
de equipo que se va a utilizar, y la temperatura de trabajo. Y como stas se deben fijar
muchas otras variables del proceso.
La variabilidad o fluctuacin de las mediciones es una consecuencia de la fluctuacin
de todos los factores y variables que afectan el proceso. Por ejemplo, cada vez que se
hace un lote de mayonesa hay que pesar el aceite segn lo que indica la frmula. Es
imposible que la cantidad pesada sea exactamente igual para todos los lotes. Tambin
se producirn fluctuaciones en la velocidad de agitacin, porque la corriente elctrica
de la lnea que alimenta el agitador tambin flucta. Y de la misma manera, de lote a
lote cambiar la cantidad pesada de los dems componentes, el tiempo de agitacin,
la temperatura, etc. Todos estos factores y muchos otros condicionan y determinan las
caractersticas de calidad del producto.
En el proceso de fabricacin de mayonesa intervienen equipos donde hacer la mezcla,
materias primas (aceite, huevos, condimentos, etc.), procedimientos de trabajo,
personas que operan los equipos, equipos de medicin, etc.:
3. OBJETIVOS

Definir la importancia del diagrama de dispersin.


Encontrar la relacin entre el diagrama de dispersin con ingeniera de
produccin.
Realizar reconocimientos del diagrama de dispersin con ejemplos reales.
Nuestro objetivo es el de proporcionar los fundamentos del anlisis de
regresin.

4. IMPORTANCIA

El diagrama de dispersin es una herramienta bsica del control de calidad asimismo


tiene la capacidad para mostrar las relaciones no lineales entre las variables. Adems,
si los datos son representados por un modelo de mezcla de relaciones simples, estas
relaciones son visualmente evidentes como patrones superpuestos.

5. MARCO TEORICO

5.1. DIAGRAMA DE DISPERSION


Es la forma ms sencilla de definir si existe o no una relacin causa efecto entre dos
variables y que tan firme es esta relacin.
Es de gran utilidad para la solucin de problemas de la calidad en un procesa y
producto, pues sirve para comprobar que causas estn influyendo en la dispersin de
una caracterstica de calidad.
Pasos para realizar un diagrama de dispersin.

PRIMER PASO: Reunir pare de datos (X, Y), cuyas relaciones se quieren estudiar y
organizar la informacin en una tabla. Por lo menos que sean 30 pares de datos.
SEGUNDO PASO: Encontrar los valores mnimo y mximo para X y Y; decidir las
escalas a usar en los dos ejes de manera que ambas sean longitudes
aproximadamente iguales.
TERCER PASO: Registrar los datos en el grfico. Cuando se obtengan los valores en
diferentes observaciones, muestre estos puntos haciendo crculos concntricos o
registre el segundo punto muy cerca del primero.
Reunir pare de datos (X, Y), cuyas relaciones se quieren estudiar y organizar la
informacin en una tabla. Por lo menos que sean 30 pares de datos
CUARTO PASO: Cerciorarse que todos los tems siguientes se incluyen en el grfico:
Ttulo del diagrama Periodo de tiempo
Numero de pares de datos Numero de pares de datos
Ttulo del diagrama Ttulo y unidades de cada eje
Diagrama de dispersin por grupos
Este tipo de diagramas sirve para hacer anlisis comparativo. Como se muestra los datos
de la Educacin Media Superior Principales siendo las Cifras 2014-2015 del Sistema
Educativo de los Estados Unidos Mexicanos:

Entidad Eficiencia Abandono Alumno/grupo Alumno/escuela Zona


Terminal Escolar
Aguascalientes 66.2 13 33.2 196.3 2
Baja California 54.7 15.1 36.1 372.1 1
Baja California 58.4 13.3 32.3 268.1 1
Sur
Campeche 58.6 14.9 29.9 250.5 3
Coahuila 67.2 14.8 27.8 181.7 1
Colima 64.6 12.5 28.1 165.5 2
Chiapas 63.9 11.4 31.7 249 3
Chihuahua 63.5 13.4 33.3 256.2 1
Distrito 54.3 16.3 27.7 679.5 2
Federal
Durango 49 18.9 30.9 270.1 1
Guanajuato 57.2 15.5 29.7 208.5 2
Guerrero 68.9 8.6 35.1 218.7 3
Hidalgo 69.2 10.4 30.5 219.3 2
Jalisco 64.5 4.3 30.6 270.7 2
Mxico 61.6 13.7 35.5 304.4 2
Michoacn 63.4 10.4 29.8 234.9 2
Morelos 59.3 14.4 28.6 227.8 2
Nayarit 57.8 16.6 25.2 148 2
Nuevo Len 64.7 12.6 28.1 310.5 1
Oaxaca 63.9 12.7 28.7 201.6 3
Puebla 73.8 9.7 28.6 153.7 2
Quertaro 66.5 11.8 33.7 268.9 2
Quintana Roo 69.8 11.2 32.7 257.5 3
San Luis Potos 67.6 11.3 35.3 219.7 1
Sinaloa 73.5 7.8 34.2 266.1 1
Sonora 65 11.2 34.8 323.7 1
Tabasco 69 11.8 34.6 298.8 3
Tamaulipas 62.9 12.4 32.7 287.4 1
Tlaxcala 66 11.7 34 261.4 2
Veracruz 67.8 13.1 25.5 178.2 3
Yucatn 59.4 13.9 32.8 217.3 3
Zacatecas 63.3 13.4 30.4 233.2 1

CUADRO 1: Principales Cifras 2014-2015


Representacin del cuadro1 en diagrama de dispersin:

FIGURA 1: Diagrama de dispersin


con datos en grupo.

FIGURA 2: Diagrama de dispersin


con datos separados.
Como leer diagramas de dispersin
Lo primero es examinar si hay o no hay puntos muy apartados en el diagrama.
Los puntos apartados pueden ser causa de errores de medicin o de
operacin.es necesario excluir estos puntos del anlisis correlacional. Sin
embargo, se le debe dar la debida atencin a la causa de esas irregularidades,
porque con frecuencia se obtiene informacin muy til averiguando porque
ocurren.
Datos atpicos
Son observaciones cuyos valores son muy diferentes a las otras observaciones
del mismo grupo de datos. Los datos atpicos son ocasionados por:
a) Errores de procedimiento.
b) Acontecimientos extraordinarios.
c) Valores extremos. Por ejemplo, una muestra de datos del nmero de
cigarrillos consumidos a diario contiene el valor 60 porque hay un fumador que
fuma sesenta cigarrillos al da.
d) Causas no conocidas.
Los datos atpicos distorsionan los resultados de los anlisis, y por esta razn
hay que identificarlas y tratarlos de manera adecuada, generalmente
excluyndolos del anlisis.
Correlacin
El anlisis de correlacin emplea mtodos para medir la significacin del grado
o intensidad de asociacin entre dos o ms variables. Normalmente, el primer
paso es mostrar los datos en un diagrama de dispersin. El concepto de
correlacin est estrechamente vinculado al concepto de regresin, pues, para
que una ecuacin de regresin sea razonable los puntos mustrales deben
estar ceidos a la ecuacin de regresin; adems el coeficiente de correlacin
debe ser:
Grande cuando el grado de asociacin es alto (cerca de +1 o -1, y pequeo
cuando
Es bajo, cerca de cero.
Independiente de las unidades en que se miden las variables.
Lnea de ajuste
Usamos la "lnea de ajuste" para hacer predicciones basndonos en datos
pasados. Hay muchas y muy complicadas frmulas para encontrar esta recta,
pero por ahora solo la dibujaremos a travs de los puntos en la grfica para que
se ajuste a la tendencia que nos marcan los datos. Cuando dibujes la recta,
asegrate de que encaje con la mayor parte de los datos. Si hay un punto que
est muy por encima o muy por debajo con respecto al resto (los atpicos) djalo
fuera de la recta.
5.2. PRINCIPIOS GENERALES

5.2.1. REGRESION LINEAL

El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la


relacin entre variables. Se adapta a una amplia variedad de situaciones. En la
investigacin social, el anlisis de regresin se utiliza para predecir un amplio rango
de fenmenos, desde medidas econmicas hasta diferentes aspectos del
comportamiento humano. En el contexto de la investigacin de mercados puede
utilizarse para determinar en cual de diferentes medios de comunicacin puede
resultarte ms eficaz invertir, o para predecir el nmero de ventas de un
determinado producto.
Tanto en el caso de dos variables (regresin simple) como en el de ms de dos
variables (regresin mltiple), el anlisis de regresin lineal puede utilizarse para
explorar y cuantifica la relacin entre una variable llamada dependiente o criterio(Y)
y una o ms variables llamadas independientes o predictores (X1, X2, X3Xk), as
como para desarrollar una ecuacin lineal con fines predictivos. Adems, el anlisis
de regresin lleva asociados una serie de procedimientos de diagnstico (anlisis de
los residuos, punto de influencia) que informan sobre la estabilidad e idoneidad del
anlisis y que proporciona pistas sobre como perfeccionarlo.

Recta de regresin

Como hemos visto que un diagrama de dispersin ofrece una idea bastante
aproximada sobre el tipo de relacin existente entre dos variables. Pero, adems,
un diagrama de dispersin tambin puede utilizarse como una forma de cuantificar
el grado de relacin lineal existente entre dos variables: basta con observar el grado
en el que la nube de puntos se ajusta a una lnea recta.

Ahora bien, aunque un diagrama de dispersin permite formarse una primera


impresin muy rpida sobre el tipo de relacin existente entre dos variables,
utilizando como una forma de cuantificar esa relacin tiene un serio inconveniente:
la relacin entre dos variables siempre es perfecta o nula; de hecho, habitualmente
no es ni lo uno ni lo otro.

Supongamos que disponemos de un pequeo conjunto de datos con informacin


sobre 35 marcas de cerveza y que estamos interesados en estudiar la relacin entre
el grado de alcohol de las cervezas y su contenido calrico. Un buen punto para
formarnos una primera impresin de esa relacin podra ser la representacin de la
nube de puntos, tal como muestra el diagrama figura :
FIGURA 2: Diagrama de dispersin
con datos separados.

El eje vertical muestra el nmero de caloras (por cada tercio de litro) y el horizontal
el contenido de alcohol (expresado en porcentaje). A simple vista, parece existir una
relacin positiva entre ambas variables: conforme aumenta el porcentaje de
alcohol, tambin aumenta el nmero de calora. En esta muestra no hay cervezas
que teniendo muchas
5.2.2. COEFICIENTE DE CORELACION

5.2.2.1. COEFICIENTE DE RELACION DE SPEARMAN

5.2.2.2. COEFICIENTE DE RALCION DE PEARSON


El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal
entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlacin de Pearson es independiente de la escala de medida de las variables
El coeficiente de correlacin entre dos variables aleatorias X e Y es el cociente

El valor del ndice de correlacin vara en el intervalo [-1, +1]:


Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia
total entre las dos variables denominada relacin directa: cuando una de ellas
aumenta, la otra tambin lo hace en proporcin constante.
Si 0 < r < 1, existe una correlacin positiva.
Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todava relaciones no lineales entre
las dos variables.
Si -1 < r < 0, existe una correlacin negativa.
Si r = -1, existe una correlacin negativa perfecta. El ndice indica una
dependencia total entre las dos variables llamada relacin inversa: cuando una
de ellas aumenta, la otra disminuye en proporcin constante.
A partir del rango se establece la siguiente tabla:

VALOR ESTADO
0.96 , 1.0 Perfecta
0.85, 0.95 Fuerte
0.70 , 0.84 Significativa
0.50 , 0.69 Moderada
0.20 , 0.49 Dbil
0.10 , 0.19 Muy dbil
0.09 , 0.0 Nula

DIAGRAMAS REPRESENTATIVOS

FIGURA 1: Diagrama de correlacin FIGURA 2: Diagrama de correlacin


Nula. Lineal Positiva.
FIGURA 3: Diagrama Lineal Negativa. FIGURA 4: Diagrama sin correlacin.

FIGURA 5: Diagrama Sin correlacin FIGURA 6: Diagrama Sin correlacin


Lineal. Lineal.

6. CONCLUSIONES

7. RECOMENDACIONES
Utilizar el programa RKWard
Hoja de clculo de Excel

8. BIBLIOGRAFIA

Potrebbero piacerti anche