Sei sulla pagina 1di 14

INTRODUCCIÓN

En la industria con mucha frecuencia es necesario resolver problemas que implican conjuntos de

variables, cuando se sabe que existe alguna relación inherente entre ellas. A partir de lo anterior,

es necesario establecer modelos que expliquen dicha relación. Cuando, simultáneamente,

contemplamos dos variables continuas, aunque por extensión se pueden emplear para variables

discretas cuantitativas, surgen preguntas y problemas específicos. Esencialmente, se emplearán

estadísticos descriptivos y técnicas de estimación para contestar esas preguntas, y técnicas de

contraste de hipótesis específicos para resolver dichos problemas. La mayoría de estos métodos

están encuadrados en las técnicas regresión y correlación. En forma más especifica el análisis de

correlación y regresión comprende el análisis de los datos muéstrales para saber qué es y cómo

se relacionan entre si dos o más variables en una población. El análisis de correlación produce un

número que resume el grado de la fuerza de relación entre dos variables; y el análisis de

regresión da lugar a una ecuación matemática que describe dicha relación. La técnica de egresión

lineal simple está indicada cuando se pretende explicar una variable respuesta cuantitativa en

función de una variable explicativa cuantitativa también llamada variable independiente, variable

regresará o variable predictora. Por ejemplo, se podría intentar explicar el peso en función de la

altura. El modelo intentaría aproximar la variable respuesta mediante una función lineal de la

variable explicativa. A partir de la presente investigación, se pretende mostrar la aplicación

práctica de la regresión y correlación lineal simple y múltiple en la industria. Ya que la

aplicación de las técnicas estadísticas contribuye a la optimización de los procesos.


JUSTIFICACION

Con los siguientes análisis vamos a corroborar que los métodos estadísticos tradicionalmente son

de gran utilidad para casos de la visa real, como es el caso en ejemplo que hemos venido

desarrollando “Indicadores de accidentalidad -220 municipios 2020 (16-1)” y que poniendo

en práctica dicho estudio de esos diferentes tipos de representación estadística, lograremos gran

parte de la utilidad que tiene la Estadística Descriptiva; es decir, nos va a proporcionar un medio

para informar basado en los datos recopilados, y a su vez se verá reflejada la eficacia con que se

pueda realizar tal proceso de información dependiendo de la presentación de dichos

datos, específicamente siendo la forma gráfica una de las formas más rápidas y eficientes de

analizar unos resultados.


OBJETIVOS

 Aprender a calcular la correlación entre dos variables

 Saber dibujar un diagrama de dispersión

 Representar la recta que define la relación lineal entre dos variables

 Saber estimar la recta de regresión por el método de mínimos cuadrados e

interpretar su ajuste.

 Realizar inferencia sobre los parámetros de la recta de regresión

 Construir e interpretar intervalos de confianza e intervalos de predicción

para la variable dependiente

 Realizar una prueba de hipótesis para determinar si el coeficiente de

correlación es distinto
Actividad 1. Mapa Mental

Descripción de la Actividad Individual:

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión,


describiendo ampliamente al menos una de ellas, regresión lineal simple o regresión múltiple.
Actividad 2. Definición de Conceptos.

Descripción de la Actividad Individual:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión.

Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su

valor medio.

A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de

estadística del colegio: rango, varianza, desviación, covarianza, coeficiente de correlación, etc.

El diagrama de dispersión, también conocido como grafico de dispersión o grafico de

correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En

otras palabras, analizamos la relación entre dos variables, conociendo que tanto se afectan entre

sí o que tan independientes son una de la otra. En este sentido, ambas variables se representan

como un punto en el plano cartesiano y de acuerdo con la relación que exista entre ellas,

definimos su tipo de correlación.

-Correlación lineal simple.


El concepto de relación o correlación se refiere al grado de variación conjunto existente entre

dos o más variables. En este apartado nos vamos a centrar en el estudio de un tipo particular de

relación llamada lineal y nos vamos a limitar a considerar únicamente dos variables (simple).

-Coeficiente de determinación R2

nos indica cuanto de la variación total en Y se debe a la variación en X, su principal propósito

es predecir futuros resultados o probar una hipótesis, es importante tener en cuenta que el

resultado del coeficiente de terminación R2 oscila entre 0 y 1. Cuanto más cerca de 1 se situé

su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. Por el

contrario, si su resultado se encuentra más cerca de cero, menos ajustado estará al modelo y

menos confiable será.

-Correlación positiva y correlación negativa

Correlación positiva.

se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y

directa, de manera que un cambio en una variable predice el cambio en la otra variable. En ese

caso, se dice que la correlación es positiva perfecta, es decir, amabas variables varían al mismo

tiempo. Este tipo de correlación es directamente proporcional.

Hay correlación positiva cuando las dos variables se correlaciona en sentido directo. Por lo que

a valores altos de una corresponden valores altos de la otra e igualmente con los valores bajos.

Correlación negativa.
se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta o

inversa, es decir, cuando una variable cambia, la otra se modifica hacia lo contrario. entonces

cuando una posee variable valores altos, la otra posee valores bajos y mientras este valor esté

más cerca de -1 más evidencia será esta covariación.

Se dice que hay correlación negativa perfecta cuando r=-1. este tipo de correlación es

inversamente proporcional. Entonces hay correlación negativa cuando las dos variables se

correlaciona en sentido inverso.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

En estadística, el coeficiente de correlación es una medida lineal entre dos variables aleatorias

cuantitativas. a diferencia de la covarianza, la correlación de Pearson es independiente de la

escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de

correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de

dos variables siempre y cuando ambas sean cuantitativas y continuas.


Actividad 3. Realizar el laboratorio de regresión y correlación lineal

Descripción de la actividad:

A partir de la base de datos ¨indicadores de accidentalidad -220 municipio 2020 (16-1).

a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas.

R/ 1. fallecidos ene- feb 2019

2. peatón

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación

entre las variables.


c. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre

la otra. ¿es confiable?

R/ y=0,0695x + 0,5404

R²= 0,4777

Esto quiere decir que el modelo matemático su confiabilidad es regular.

d. Determine el grado de correlación de las dos variables.


R/ 0,4777 x 100% = 0,47

✓ 0, 4777= 0,69

e. Relacionar la información obtenida con el problema.

R/ correlación es regular ya que hay más fallecidos en el rango de esos meses que de

objeto choque (peatón).

ACTIVIDAD 4. REGRESIÓN Y CORRELACIÓN MÚLTIPLE

A partir de la base de datos suministrada “Indicadores de accidentalidad -220 municipios 2020


(16-1)”, cada estudiante, deberá:

a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas


independientes del estudio de investigación.

Variables cuantitativas dependiente

- Edad
Variable cuantitativa independiente

- Número de fallecidos
- Velocidad promedio

b. Realizar el diagrama de dispersión de dichas variables.


c. Calcular la recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación.

Y= a + bx
Y= 0,1818x + 31,102
R² = 0,0051

El modelo matemático que encontramos no es confiable ya que el valor que nos arrojó R² es muy
cercano al valor de 0, esto quiere decir que la correlación entre la edad y el número de los
fallecidos es demasiado baja.

d. Relacionar la información obtenida con el problema.

El porcentaje de explicación corresponde a 0,0051x100=0,51

El grado de correlación se presenta por: R= √ 0,0051=0,071


De acuerdo con el resultado del grado de correlación logramos encontrar que no existe
una correlación entre las variables de edad y número de fallecidos.
CONCLUSIONES

El análisis de regresión y correlación lineal constituyen métodos que se emplean para conocer las

relaciones y significación entre series de datos. Lo anterior, es de suma importancia para la

industria ya que es aquí en donde se presentan variables de respuesta e independientes las cuales

interactúan para originar las características de un proceso en particular y por ende; analizar,

predecir valores de la variable dependiente y examinar el grado de fuerza con que se relacionan

dichas variables. La regresión lineal simple y la regresión múltiple, analiza la relación de dos o

más variables continuas, cuando analiza dos variables a esta se le conoce como variables

bivariantes que pueden corresponder a variables cualitativas. La finalidad de una ecuación de

regresión es la de estimar los valores de una variable con base en los valores conocidos de la

otra. Del mismo modo, una ecuación de regresión explica los valores de una variable en términos

de otra. Es decir, se puede intuir una relación de causa y efecto entre dos o más variables. El

análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Por

otro lado, Al ajustar un modelo de regresión simple o múltiple a una nube de observaciones es

importante disponer de alguna medida que permita medir la bondad del ajuste. Esto se consigue

con los coeficientes de correlación. Si el modelo que se ajusta es un modelo de regresión lineal, a

R se le denomina coeficiente de correlación y representa el porcentaje de variabilidad de la Y

que explica el modelo de regresión. Estas técnicas estadísticas constituyen una herramienta útil

para el análisis de las variables de un proceso ya que, a través de la aplicación de éstas, es

posible conocer el modelo que siguen y la fuerza con que se encuentran relacionadas. Asimismo,

es posible explicar la relación que guardan dos o más causas de un posible defecto.
REFERENCIAS BIBLIOGRAFICAS

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados. México

City: Cengage Learning. Páginas 686 – 695

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage

Learning. Páginas 675 – 686

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados. México

City: Cengage Learning. Páginas 686 – 695

Potrebbero piacerti anche