Sei sulla pagina 1di 4

WORKING ADULT

IV UNIDAD ANLISIS DE REGRESIN Y CORRELACIN LINEAL


CONTENIDOS CONCEPTUALES

CONTENIDOS PROCEDIMENTALES

UNIDAD 4: Anlisis de Regresin y


Correlacin Simple
a. Nociones bsicas. Diagrama de
dispersin. Anlisis de Regresin simple.
Ajuste de la ecuacin. Interpretacin de
la Pendiente
b. Error estndar de estimacin. Estimacin
puntual e intervlica
c. Anlisis de correlacin lineal simple.
Coeficiente de correlacin. Frmula e
interpretacin. Coeficiente de
determinacin. Frmula e interpretacin.

UNIDAD 4: Anlisis de Regresin y


Correlacin Simple
a. Comprenden los conceptos y la
necesidad de la regresin y correlacin
para dos conjuntos de valores con cierta
relacin o dependencia entre s, mediante
la presentacin de algunos casos de
aplicacin.
b. Establecen la relacin lineal de
dependencia entre dos conjuntos de
datos.
c. Estiman valores de una de las variables
consideradas a partir del valor de la otra.

1. Regresin Lineal Simple


Con frecuencia, las variables que constituyen una distribucin bidimensional muestran un cierto
grado de dependencia entre ellas. Un ejemplo de esta relacin aparece en la relacin de peso y
altura: aunque no existe una ley causal que relacione ambas variables, en trminos estadsticos
se aprecia una dependencia entre ellas (cuando aumenta la altura, suele hacerlo tambin el peso).
Esta dependencia se refleja en la nube de puntos que representa a la distribucin, de modo que
los puntos de esta grfica aparecen condensados en algunas zonas.
Si deseamos estudiar la relacin entre dos variables cuantitativas y adems una de ellas puede
considerarse como variable dependiente o respuesta podemos considerar el uso de la regresin
lineal simple. Con la regresin, aparte de medir el grado de asociacin entre las dos variables,
podremos realizar predicciones de la variable dependiente.
En tales casos, se pretende definir una ecuacin de regresin que sirva para relacionar las dos
variables de la distribucin. La representacin grfica de esta ecuacin recibe el nombre de lnea
de regresin, y puede adoptar diversas formas: lineal, parablica, cbica, hiperblica, exponencial,
etc.

Diagrama de
Dispersin o
Nube de
puntos

Correlacin
entre la
Velocidad de
onda y la
Resistencia a
la Compresin

Anlisis de regresin
Propsito: determinar la ecuacin de regresin; se usa para predecir el valor de la variable
dependiente (Y) basado en la variable independiente (X).

Estadstica General

WORKING ADULT
Procedimiento: seleccionar una muestra de la poblacin y enumerar los datos por pares para cada
observacin; dibujar un diagrama de dispersin para visualizar la relacin; determinar la ecuacin
de regresin.
Cuando la lnea de regresin se asemeja a una recta (regresin lineal), puede ajustarse a esta
forma geomtrica por medio de un mtodo general conocido como mtodo de los mnimos
cuadrados. La recta de ajuste tendr por ecuacin:
Y=a+bX

Y = 0 + 1X

Vamos a llamar a X: variable independiente o explicativa, y a la otra la llamaremos Y: variable


dependiente o explicada.
es el valor promedio pronosticado de Y para cualquier valor de X.
a es la intercepcin en Y, o el valor estimado de Y cuando X = 0
b es la pendiente de la recta, o cambio promedio en Y por cada cambio de una unidad en X:
Donde los coeficientes a y b 0 y 1 se calculan teniendo en cuenta que la recta debe pasar por
el punto
y la separacin de los puntos de la grfica de dispersin con respecto a la recta de
regresin debe ser mnima.
Coeficiente de correlacin de Pearson (r)
Si tenemos dos variables cuantitativas y deseamos medir el grado de asociacin podemos utilizar
el coeficiente de correlacin de Pearson. En primer lugar, es muy aconsejable realizar un grfico
de dispersin entre ambas variables y estudiar visualmente la relacin entre ellas. Este coeficiente
mide asociacin lineal y al ser una prueba paramtrica requiere para su uso que ambas variables
tengan distribuciones normales. De no ser as, deberemos utilizar el coeficiente no paramtrico de
Spearman.
El coeficiente de correlacin de Pearson (r) puede tomar valores entre -1 y +1, de modo que un
valor de r positivo nos indica que al aumentar el valor de una variable tambin aumenta el valor
de la otra y por el contrario, r ser negativo si al aumentar el valor de una variable disminuye la
otra. La correlacin ser perfecta si r= 1, en este caso los puntos formarn todos una recta.

Es importante notar que el uso del coeficiente de correlacin slo tiene sentido si la relacin a
analizar es del tipo lineal. Si sta no fuera no lineal, el coeficiente de correlacin slo indicara la
ausencia de una relacin lineal ms no la ausencia de relacin alguna.
El coeficiente de determinacin r2
El coeficiente de determinacin, r2 - la proporcin de la variacin total en la variable dependiente
Y que est explicada por o se debe a la variacin en la variable independiente X. El coeficiente de
determinacin es el cuadrado del coeficiente de correlacin, y toma valores de 0 a 1.
El objetivo principal del anlisis de regresin es proyectar el valor de la variable dependiente
conociendo o suponiendo valores para la variable independiente. La confiabilidad de las
proyecciones est dada por la confiabilidad de la ecuacin, la cual se mide a travs del coeficiente
de determinacin y de los errores de los coeficientes de regresin.
Estadstica General

WORKING ADULT
Una vez ajustada la recta de regresin a la nube de observaciones es importante disponer de una
medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es
suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste se utiliza el
coeficiente de determinacin, definido como sigue:
R2 % = (R2) 100

Donde:

R: Coeficiente de Correlacin.

Usos incorrectos de los coeficientes de correlacin


Siempre hay que tener mucho cuidado con la interpretacin de un coeficiente de correlacin
puesto que otras variables, llamadas de confusin, pueden ser las causantes reales de la
asociacin. Esto sucede cuando dos variables independientes entre s dependen ambas de una
tercera. Por ejemplo est demostrado que en los nios, existe una correlacin positiva entre el
tamao del pie y su capacidad para sumar. Sin embargo lo que en realidad sucede es que los
nios con mayor pie, son tambin los de mayor edad y por tanto los que mejor suman. Este tipo
de correlaciones se denominan espreas o engaosas y nos pueden llevar a conclusiones
errneas.
Tambin hay que advertir a aquellos investigadores que tengan la tentacin de correlacionar un
nmero grande de variables cuantitativas con el nico objetivo de a ver si encuentro algo. Aparte
de tener una difcil justificacin este modo de actuar, si cruzramos solo 20 variables todas ellas
independientes, tendramos hasta 190 pares de variables en los que estudiar la correlacin, y slo
por azar, es de esperar aproximadamente unas 9 10 como significativas.
Tampoco debemos utilizar la correlacin para evaluar la concordancia entre dos medidas
cuantitativas, siendo aconsejables otros ndices como el coeficiente de correlacin intraclase y
otra serie de tcnicas.
Ejercicios:
1. La siguiente tabla y grfica muestran el consumo mensual de energa en funcin del rea del
domicilio:
2

rea (m )

119,8 125,4 136,6 148,8 158,9 170,9 183,9 207,2 223,0 272,2

Consumo (kw-hrs)

1180 1170 1260 1490 1570 1710 1800 1840 1960 1950

a) Represente grficamente los puntos. Comente al respecto.


b) Construya y grafique la recta de regresin de mnimos cuadrados que permita predecir
el consumo de energa en funcin del rea del domicilio.
c) Interprete la pendiente de la recta de regresin.
d) Calcule e interprete el error estndar de estimacin.
e) Realice una estimacin del consumo, en base al rea.
f) Calcule e interprete el Coeficiente de Correlacin R.
g) Calcule e interprete el Coeficiente de Determinacin R2.
2.

En el servicio central de turismo del pas se ha observado que el nmero de plazas hoteleras
ocupadas es diferente segn sea el precio de la habitacin. Sobre el total de plazas ocupadas
en un ao se tiene:
Precio
(S/.noche)
N Habitac
Ocupadas

a)
b)
c)
d)
e)
f)
g)

260

650

1000

1400

2100

2500

2700

3300

4000

4725

2610

1872

943

750

700

700

580

500

Represente grficamente los puntos. Comente al respecto.


Construya y grafique la recta de regresin de mnimos cuadrados.
Interprete la pendiente de la recta de regresin.
Calcule e interprete el error estndar de estimacin.
Cuntas habitaciones se llenaran a S/1500?
Calcule e interprete el Coeficiente de Correlacin R.
Calcule e interprete el Coeficiente de Determinacin R2.

Estadstica General

WORKING ADULT
3.

El volumen de ahorro y la renta del sector familias en millones de soles, para el perodo 20022011 fueron:
Ao

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

Ahorro
Renta

1.9
20.5

1.8
20.8

2.0
21.2

2.1
21.7

1.9
22.1

2.0
22.3

2.2
22.2

2.3
22.6

2.7
23.1

3.0
23.5

a) Encuentre la recta de regresin considerando el ahorro como variable independiente.


b) Encuentre la recta de regresin considerando la renta como variable independiente
c) Para el ao 2012 se supone una renta de 24.1 millones de soles. Cul ser el ahorro
esperado para ese ao?
d) Calcule e interprete el Coeficiente de Correlacin R, para cada caso.
e) Calcule e interprete el Coeficiente de Determinacin R2, para cada caso.
4.

Se realiza un estudio para determinar el efecto de la reduccin de las horas de sueo sobre la
habilidad para resolver problemas sencillos. La reduccin de las horas de sueo es de 8, 12,
16, 20 y 24 horas sin dormir. En el estudio participaron un total de 10 individuos, con dos en
cada nivel de reduccin. Despus de su perodo especfico de reduccin de horas de sueo,
cada individuo fue sometido a un conjunto de problemas simples de suma, observndose el
nmero de errores. Los resultados fueron:
Nmero de errores (Y)
Reduccin de horas de sueo (X)
a)
b)
c)
d)

5.

8, 6
8

6, 10
12

8, 14
16

14, 12
20

16, 12
24

Grafica el diagrama de dispersin de puntos.


Encuentra la recta de mnimos cuadrados apropiada para estos datos.
En el diagrama de dispersin de puntos, grafica la recta de mnimos cuadrados.
Interpreta los coeficientes de regresin.

Los gastos semanales de publicidad y las ventas semanales de una empresa, en dlares,
para una muestra de diez semanas son:
Gastos semanales
41
54
63
de publicidad
Ventas semanales 1250 1380 1425

54

48

46

62

61

64

71

1425 1450 1300 1400 1510 1575 1650

a) Establece la recta de regresin de mnimos cuadrados que permita predecir las


ventas semanales en funcin de los gastos en publicidad.
b) Representa grficamente los puntos y la recta de mnimos cuadrados. Comenta.
c) Interpreta la pendiente de la recta de regresin.
d) Pronostica las ventas para gastos semanales de publicidad de 50 y 60 dlares.
e) Cules son los errores de estimacin cuando se predice las ventas semanales para
gastos semanales de publicidad de 61, 62 y 63 dlares respectivamente?
6.

Las calificaciones en un examen de estadstica y el nmero de horas de estudio para el


examen, de una muestra de doce estudiantes de una seccin, se presentan en el siguiente
cuadro.
Tiempo de estudio
Calificacin

3
9

3
12

3
11

4
12

4
15

5
14

5
16

5
15

6
18

6
16

7
15

8
17

a) Halla la recta de regresin de mnimos cuadrados considerando la calificacin en el


examen como variable dependiente.
b) Interpreta la pendiente de la recta de regresin.
c) Calcula el error estndar de estimacin. Para qu se utiliza esta medida?
d) Qu porcentaje de la calificacin se explica por el tiempo de estudio?

Estadstica General

Potrebbero piacerti anche