Sei sulla pagina 1di 34

PROBABILIDAD Y ESTADÍSTICA

• Integrantes: FABRO BAUSTISTA


QUINTERO ENZO GABRIEL
• Carrera: Ingeniería Civil

• Tema: Regresión y Correlación Lineal


REGRESION Y CORRELACION LINEAL

SE DIVIDE EN

REGRESION CORRELACION

TIPOS GRADOS
TIPOS

DIRECTA NULA
FUERTE
NULA
INVERSA DEBIL
SIMPLE MULTIPLE
CORRELACIÓN

• La correlación trata de establecer la relación o


dependencia que existe entre las dos variables que
intervienen en una distribución bidimensional.
• Es decir, determinar si los cambios en una de las variables
influyen en los cambios de la otra. En caso de que suceda,
diremos que las variables están correlacionadas o que
hay correlación entre ellas.
Después de establecer la muestra poblacional y las dos variables
que queremos estudiar, se procede a hacer el análisis de
información.

Para hacer el estudio es importante analizar la información y


establecer quien es la variable independiente y quien es la
variable dependiente.
Por Ejemplo: La calificación depende de las horas
estudiadas.
Variable Dependiente: Calificación (y)
Variable Independiente: Horas Estudiadas (x)
• Los resultados de estas variables pueden
presentarse a través de Tablas o Pares
Ordenados.

• Para empezar con el estudio, se


recomienda realizar en primera instancia
el diagrama de dispersión, el cual nos
dará una idea de como se encuentran los
datos distribuidos.
Diagrama de dispersión de
puntos
• Dos variables cuantitativas
• Una variable es llamada independiente (X)
y la otra dependiente (Y)
• Los puntos no se unen
• No es tabla de frecuencias
Y
* *
*
X
DISPERSIÓN DE PUNTOS

El modelo de los datos es indicativo del tipo


de relación entre las dos variables:
Relación positiva
Relación negativa
No hay relación
RELACIÓN POSITIVA
Calificación final del curso

Número de horas para estudio


18

16

14

12
Estatura en cm

Height in CM

10

0
0 10 20 30 40 50 60 70 80 90
Age in Weeks

Edad en semanas
RELACIÓN NEGATIVA

Confiabilidad

Edad del Auto


SIN RELACIÓN
Peso (libras)

Tasa de pulso (latidos/minuto)


COEFICIENTE DE CORRELACIÓN

• Estadístico que muestra el grado de


relación entre las dos variables

• Para proceder a desarrollar el método se


requiere calcular el Coeficiente de
Correlación Lineal (r).
COEFICIENTE DE CORRELACIÓN
SIMPLE (R)
También llamado correlación de
Pearson
Mide la naturaleza y fuerza entre dos
variables cuantitativas.
El signo de r denota la naturaleza
de la asociación

Mientras que el valor de r denota la


fuerza de asociación.
Si el signo es positivo, significa que la relación
es directa (un incremento en una variable está
asociado con el incremento de la otra variable;
una disminución de una variable está asociado
con la disminución de la otra variable).

Si el signo es negativo, significa una relación


inversa o indirecta (significando que el
incremento en una variable está asociado con
una disminución de la otra variable).
El valor de r está entre ( -1) y ( +1)
El valor de r denota la fuerza de la asociación
como se ilustra en el siguiente diagrama.

fuerte intermedio débil débil intermedio fuerte

-1 -0.75 -0.25 0 0.25 0.75 1


indirecta Directa
Correlación correlación
perfecta perfecta
sin relación
Si r = cero significa que no hay asociación o
correlación entre las dos variables.

Si 0 < r < 0.25 = débil correlación.

Si 0.25 ≤ r < 0.75 = intermedia correlación.

Si 0.75 ≤ r < 1 = fuerte correlación.

Si r = l = perfecta correlación.
¿Cómo clacular el coeficiente de correlación
simple (r)?
Las dos variables son de tipo cuantitativo, una variable,
como por ejemplo la edad, la cual llamada independiente
y como variable dependiente podríamos llamar al Peso, la
cual se denota con letra Y, para encontrar la relación entre
edad y peso, se calcula el coeficiente de correlación
simple de la siguiente manera
TIPOS DE CORRELACIÓN
Correlación directa: La correlación directa se da
cuando al aumentar una de las variables la otra
aumenta. La recta correspondiente a la nube de
puntos de la distribución es una recta creciente.
TIPOS DE CORRELACIÓN
• Correlación inversa: La correlación inversa
se da cuando al aumentar una de las
variables, la otra disminuye. La recta
correspondiente a la nube de puntos de la
distribución es una recta decreciente.
TIPOS DE CORRELACIÓN
• Correlación nula: La correlación nula se da
cuando no hay dependencia de ningún tipo
entre las variables. En este caso se dice que
las variables son incorreladas y la nube de
puntos tiene una forma redondeada.
REGRESIÓN

• En estadística la regresión lineal es


un método matemático que modeliza la relación
entre una variable dependiente (Y), y
las variables independientes(Xi ).
• Para poder crear un modelo de regresión lineal,
es necesario que se cumpla con los siguientes
supuestos:[
• La relación entre las variables es lineal.
• Los errores en la medición de las variables explicativas
son independientes entre sí.
• Los errores tienen varianza constante.
• Los errores tienen una esperanza matemática igual a cero
(los errores de una misma magnitud y distinto signo son
equis-probables).
• El error total es la suma de todos los errores.
SBP(mmHg)
220

200

180

160

140

120

100

80
Wt (kg)
60 70 80 90 100 110 120
Usando el método de los cuadrados mínimos (un
procedimiento que minimiza las desviaciones
verticales de puntos trazados alrededor de la
línea recta) somos capaces de construir el mejor
trazado de la línea recta en la gráfica de puntos
dispersos y luego formular la ecuación de
regresión en la forma de:

ŷ  a  bX
ECUACIÓN LINEAL
Y
ŷ = bX
Y a +bX
a
b=
Cambio
Change
b = Slope en
pendiente in Y
Change in
Cambio enXX
a
a == Y-intercept
intersección
X
TIPOS DE MODELOS DE
REGRESIÓN LINEAL
Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a
sus parámetros:

• Regresión lineal simple: Sólo se maneja una variable


independiente, por lo que sólo cuenta con dos parámetros.
• Regresión lineal múltiple: La regresión lineal nos permite
trabajar con una variable a nivel de intervalo o razón, así
también se puede comprender la relación de dos o más
variables y nos permitirá relacionar mediante ecuaciones,
una variable en relación a otras variables llamándose
Regresión múltiple.
APLICACIONES EN EL ÁMBITO
DE LA INGENIERÍA
• 1. Descripción de datos . Ingenieros y científicos frecuentemente
utilizan ecuaciones para resumir un conjunto de datos. El análisis de
regresión es útil para describir los datos.
• 2. Estimación de parámetros. Uno de los casos en los cuales se utiliza el
análisis de regresión para estimar parámetros es el siguiente: Suponga
que un circuito eléctrico contiene una resistencia conocida de ohms.
Diferentes corrientes pasan a través del circuito y el correspondiente
voltaje es medido. El diagrama de dispersión podría indicar que el
voltaje y la corriente están relacionados por una línea recta que pasa
por el origen con pendiente (debido a que el voltaje y la corriente
están relacionados por la ley de Ohm ). El análisis de regresión podría
ser utilizado para ajustar este modelo a los datos, produciendo un
estimado de la resistencia desconocida.
APLICACIONES EN EL ÁMBITO
DE LA INGENIERÍA
• 3. En el ámbito de la Ingeniería Civil.
-El rendimiento de los Trabajadores en una Obra.
-El monitoreo de ingresos y egresos de Recursos.
-Demanda de materiales.
EJERCICIO 1:
Un ingeniero realizo un estudio con miras a determinar si existe una relación lineal entre la resistencia a la ruptura, y,
de vigas de madera y el peso relativo, x, de la madera. Diez (10) vigas seleccionadas al azar con las mismas
dimensiones de sección transversal se sometieron a esfuerzo hasta romperse. En la tabla de muestra la resistencia a
la ruptura y el peso especifico relativo de la madera para cada una de las diez (10) vigas.
A- Determine Recta y=ax+b obteniendo los valores de a y b, luego dibuje la mencionada recta sobre el diagrama.
B- Obtenga el coeficiente de correlación muestral r e interprételo.

Viga X Y X^2 Y^2 XY


1 0,499 11,14 0,249001 124,0996 5,55886
2 0,558 12,74 0,311364 162,3076 7,10892
3 0,604 13,13 0,364816 172,3969 7,93052
4 0,441 11,51 0,194481 132,4801 5,07591
5 0,55 12,38 0,3025 153,2644 6,809
6 0,528 12,6 0,278784 158,76 6,6528
7 0,418 11,13 0,174724 123,8769 4,65234
8 0,48 11,7 0,2304 136,89 5,616
9 0,406 11,02 0,164836 121,4404 4,47412
10 0,467 11,41 0,218089 130,1881 5,32847
∑ 4,951 118,76 2,488995 1415,704 59,20694
GRAFICO DE DISPERSION Y RECTA

13.5

y = 10,829x + 6,5143
13

12.5

12

11.5

11

10.5

10
0.35 0.4 0.45 0.5 0.55 0.6 0.65
r = 0,913135
Fuerte correlación directa

fuerte intermedio débil débil intermedio fuerte

-1 -0.75 -0.25 0 0.25 0.75 1


indirecta Directa
Correlación
perfecta
sin relación
EJERCICIO 2:
Un grupo de investigación, dedicado a la búsqueda de fuentes alternativas de energía, se encuentra
realizando mediciones en la zona de Las Termas de Santa Teresita, provincia de La Rioja, para
determinar la posibilidad de aprovechar la energía geotérmica; para ello realizaron mediciones en
diferentes pozos de agua, y sabiendo que la cantidad de energía contenida en una libra de agua esta
en función de su temperatura, se preguntan si el agua extraída de los pozos mas profundos
contendrán mayor cantidad de energía por unidad de masa. Los datos que obtuvieron en las
mediciones, son los siguientes:
A- Determine Recta y=ax+b obteniendo los valores de a y b, luego dibuje la mencionada recta sobre el
diagrama.
B- Obtenga el coeficiente de correlación muestral r e interprételo.

# X Y X^2 Y^2 XY
1 645 224 416025 50176 144480
2 1103 235 1216609 55225 259205
3 997 252 994009 63504 251244
4 598 197 357604 38809 117806
5 1152 218 1327104 47524 251136
6 811 249 657721 62001 201939
7 791 221 625681 48841 174811
8 738 179 544644 32041 132102
9 1372 263 1882384 69169 360836
10 571 161 326041 25921 91931
11 1234 219 1522756 47961 270246
∑ 10012 2418 9870578 541172 2255736
a=0,072465
b=153,8623
r=0,642116
300

250
y = 0,0725x + 153,86

200

150

100

50

0
0 200 400 600 800 1000 1200 1400 1600

Potrebbero piacerti anche