Sei sulla pagina 1di 24

REGRESIN LINEAL

PAMELA NUEZ DEL PRADO


ACTIVIDAD
Estoy
Estoy ms o Estoy ms o Estoy en totalmente
Estoy totalmente Estoy de
menos de menos en desacuerdo en
de acuerdo (6) acuerdo (5)
acuerdo (4) desacuerdo (3) (2) desacuerdo
(1)

Yo tengo cierto nivel de "inteligencia",


y la verdad es que no puedo hacer
mucho para cambiarlo

Mi inteligencia es algo con lo que nac,


por lo tanto, no lo puedo cambiar

No importa quien sea, yo puedo


incrementar mis niveles de inteligencia

Para ser honestos, uno no puede


cambiar que tan inteligente es
CLCULO DE PUNTAJE

TEM 1 = INVERSO CONVERTIR


TEM 2 = INVERSO CONVERTIR
TEM 3 = DIRECTO
TEM 4 = DIRECTO

PUNTAJE TOTAL = TEM 1 CONVERTIDO + TEM 2 CONVERTIDO + TEM 3 + TEM 4


PERFORMANCE
ACTIVIDAD:
ENTRA A TU PGINA DE HISTORIA PERSONAL. REVISA RENDIMIENTO ACADMICO Y TOMA
NOTA DE TU CRAEST Y TU PROMEDIO PONDERADO. LUEGO, ENTRA A HISTORIA DE NOTAS
Y TOMA NOTA DE TU PROMEDIO EN INVESTIGACIN Y ESTADSTICA 1.
PORQU DESARROLLAR UN GROWTH MINDSET?
Ver video:
https://www.youtube.com/watch?v
=hiiEeMN7vbQ&t=20s

Carol Dweck- University of


Stanford
PORQU DESARROLLAR UN GROWTH MINDSET?
teora que dice que, salvo variaciones
MODELO DE REGRESIN
na determinada LINEAL cuantitativa X
variable
otra variable cuantitativa
Y= Desempeo
Y de modo que
inducen cambios proporcionales en Y; deseamos
con datos de una muestra aleatoria. Geomtricamente la
proporcionalidad equivale a
que en un plano cartesiano
la proporcionalidad equivale a que en un las parejas de valores (X y Y),
describen o siguen una
ano XY, las parejas de valores (X,Y) descri- trayectoria rectilnea.

una trayectoria rectilnea.

la proporcionalidad equivale a que X Mindset


X= Growth e Y sa-
cuacin Y = b 0 + b1 X + e donde b 0 y b1 son
e
OTRO EJEMPLO:
CULES SERAN LAS HIPTESIS?
El grupo de APEGO PUCP dirigido por Magaly Nblega considera que el
apego materno de un adolescente (Nivel de seguridad percibida por el
adolescente en la relacin con su madre) es factor protector contra
tendencias depresivas y tambin es factor promotor de mayor cuidado de
relaciones romnticas por parte del adolescente. En ambos casos se asume
relacin de proporcionalidad como una primera aproximacin. Para evaluar
sus hiptesis tomaron una muestra de adolescentes y aplicaron el inventario
de apego con padres y pares (IPPA, Armsden y Greenberg, 1987), el
inventario de depresin de Beck y la Escala de Cuidado de las Relaciones
Romnticas de Davis (1996), sta ltima mide factores como la asistencia o
apoyo, dar lo mximo posible en la relacin, llevar la delantera, etc.
alejados de la tendencia.

Figura 2 Depresin
Ejemplo 2 vs Apego Cuidado Relaciones vs Apego
Unos investigadores consideran que el Apego materno en un
adolescente (nivel de seguridad percibida por el adoles-
cente en la relacin con su madre) es factor protector contra ten-
dencias depresivas y tambin es factor promotor de mayor cuidado de relaciones
romnticas por parte del adolescente. En ambos casos se asume rela-
cin de proporcionalidad como una primera aproximacin.
Para evaluar sus hiptesis tomaron una muestra de adoles-
centes y aplicaron el Inventario de apego con padres y pares (IPPA,
Armsden & Greenberg, 1987), el Inventario de Depresin de Beck y
la Escala de Cuidado de las relaciones romnticas de Davis (1996), sta
ltima mide factores como la asistencia o apoyo, dar lo El
mximo posible en la relacin, llevar la delantera, etc. ne
Pareciera que con la Depresin la tendencia es ms clara
queLas
conecuaciones
el Cuidadoseran:
de relaciones, pero como las variables
1.
Depresin
Depresin b 0 + b1 Apego
y =Cuidado +e D con
no tienen las bmismas unidades de me-
1 < 0 , e D =efecto del azar en
dida, se necesita anlisis ms finos para obtener
la depresin
conclusiones confiables Da
Cuidado = a 0 + a1 Apego + e C con a 1 > 0 , e C =efecto del azar
al
Ejemplo 3
Un psiclogo social estudia la relacin entre Ingreso y cu
PUEDEN HABER RELACIONES NO
LINEALES?
EST-203 ESTADISTICA II Ar tur o Calder n G. 2010 4

Figura 2 Ingreso y Experiencia laboral

Por qu creen que sto es as?

Qu es lo que puede haber


sucedido?

Que otros ejemplos de


relaciones no lineales se
imaginan?

Como suelen ser las relaciones


entre variables psicolgicas?

El diagrama muestra que la relacin propuesta no es li-


neal
na trayectoria rectilnea.
ms clara
variables SUPUESTOS TERICOS
+ e , Yevaluado
a proporcionalidad1.2equivale
Supuestos ya parmetros
que X e del Y sa- modelo
es de me-
er
= b + b X +e
en unab muestra
b
uacin 0 modelo Y =0 b 0y
1 Dado el donde + b1 X1 + eson , evaluado en

1 ), ( X 2 , Y2 ), L
Yactersticas o ,sea
( X nson , en general
, Yn )parmetros y e es se
aleatoria de n parejas ( X 1 , Y1 ), ( X 2 , Y2 ),L, ( X n , Yn ) ,
= b 0 personas
+ bde1 Xotras
j + evariables
e j represent
e
aleatoria
ngreso y debida a que
cumple
Representa Ylas
el efectoj mezclado nono tie-
j donde
eados de controladas para el cul
mezclado deseotras
asume que se comportano
variables el controladas
iempre
diferen- el
nde j mismo comportamiento.
representa el efecto
azar, como variable aleatoria,
se asume que se habiendo independencia
comporta como el azar, c
Ingreso en entre observaciones: e ~ N (0, s ) 2

s no controladas,
s que el leatoria:
ciones para el cual
habiendo independencia

1988)
omo estudiaron
el azar, la relacin
como entre
variableestrs y a-
lgico enEntonces.
b1 > 0 una muestra Qu es elde error?
universitarios.
Formalmente:
con
E (e ) = 0 "j
do independencia entre
X con una (a)construida
escala observa-
a partir
j
de
2
estimando b 0 , b 1 y reemplazando luego en el modelo. El

PARMETROS DEL MODELO


n el "error" en el pronstico se puede aproximar en una pri-
mera instancia con la estimacin de s .
oo
1.3 Los estimadores
En La constante Bo llamada constante en SPSS es el origen o intercepto de la recta
nta en Dada la muestra los estimadores son:
Qu quiere decir eston en trminos psicolgicos?n n

(Y X Y X Y
clina
j - Y )( X j - X ) j j - nXY j j - nXY
j =1 0 inteligencia? Es posible
j =1tener 0 autoestima? jEs rXY Smindset?
=1 posible tener 0 growth
b1 = tener
Reflexin: Es posible = = = Y
medio
n n
( n - 1) S X
2

(X - X ) X
SX
- nX
2 2 2
j
j =1 j =1

b0 = Y - b1 X
La prediccin de Y es Y = b0 + b1 X o Yj = b0 + b1 X j
Aproximamos e con e = Y - Y , o sea e j = Y j - Y j
s2 se estima con
n n

e
j =1
2
j (Y
j =1
j - Y j ) 2
( n - 1) S Y2 (1 - rXY
2
)
s =
Bo: No es nada ms
S 2
e = 2
= =
y nada menos que EL VALOR ESPERADO O PROMEDIO
, que viene a ser DE Y
n-2 n-2 n-2
CUANDO Xla
ES distancia
0 promedio al cuadrado entre un valor real
de Y y su valor esperado o prediccin a partir de X
El Error Estndar o Error tpico de estimacin es
G. 2010 5
PARMETROS DEL MODELO
EST-203 ESTADISTICA II Ar tur o Calder n G. 2010 6

Podemos pronosticar el valor esperado de Y : E (Y ) = b + b1 X ,


La constante B1 se llama pendiente de la recta. 0

estimando b 0 , b 1 y reemplazando luego en el modelo. El


da en el "error" en el pronstico se puede aproximar en una pri-
mera instancia con laQue quiere decir
estimacin de sto?
s.
rado o
1.3 Los estimadores
ta. En B1: Mide en cuantas unidades se espera que vare Y cuando X aumenta en 1 unidad. Por lo tanto es
umenta en la inclinacin Dada
de la recta.
la muestra los estimadores son:
n n n

(Y X Y X Y
inclina
j - Y )( X j - X ) j j - nXY j j - nXY
. j =1 j =1 j =1 rXY SY
b1 = = = =
promedio
n n
( n - 1) S X2
(X - X ) X
SX
- nX
2 2 2
j
j =1 j =1

Qu pasara si bB0 Y - b1 X
0 =>0?
Qu pasara si B0 < 0?
La prediccin de Y es Yj = b0 + b1 X j
Y = b0 + b1 X o

En el caso deGrowth mindsete y desempeo,


Aproximamos con e = Y -Cul seala ehiptesis?
Y , osera j = Y j - Y j
s se estima con
2
La prediccin de Y es Y = b0 + b1 X o Yj = b0 + b1 X j
e e j = Y j - Y j
PARMETROS
s
DEL MODELO
Aproximamos
2
se estima con
con e = Y - Y , o sea

n n

El Error Estndar e

2
(Y - Y ) 2
de estimacin
j j o jError tpico es
( n - 1) S 2 el Margen
(1 - r 2 de error asociado al pronstico
= = XY )
s = S e =
2 2 j 1
=
j 1
= Y
, que viene a ser
n-2 n-2 n-2
la distancia promedio al cuadrado entre un valor real
Uno puede puede predecir el comportamiento o performance de una persona a partir de su
de Y y su valor esperado o prediccin a partir de X
puntaje en una prueba que mide Growth Mindset
El Error Estndar o Error tpico de estimacin es
s = s 2 . Es el margen de error asociado pronstico:
Y = Y s = b0 + b1 X s

Como Como b1 eses una


B1 muestral estimacin
una estimacin del
del B1 verdadero
poblacional tienebtambin
1 , tiene tam- de estimacin.
un error
bin un "error de estimacin", cuyo cuadrado es
Uno puede s
2
S medir
= n el growth,mindset
2
b1
de una persona a partir de la prueba que rindieron al inicio de
as que el Error Estndar de estimacin
clase?

X 2 - nX
2
j
j =1

s 2 s 2
- de b1 es EEb1 = S b1 = n
=
(n - 1) S X2 .
X - nX
2 2
o j
j =1
La prediccin de Y es Y =
1.3 Los estimadores n n

PARMETROS e
DEL
(Y - Y )
MODELO
2 2

(Y - Y )( X - Xn )- 2 X Y -nn-X2e -2 e
( n - 1) S (1 - r )
j j j

= -
Dada la muestra los jestimadores son: 2 2
=1 j =1
s = S = = =

2 2 Y XY

Aproximamos Y Y
, que viene
Y Xcon
n
e n n

j j Y - n nX Y j j j j

b = la distancia
j =1
= promedio= al cuadrado = entre un valor
r Sj =1 j =1 XY Y
( n - 1) S X2
1

n n

2 j=Es1 la varianza del azar, porj=1lo tanto


sb = Y - bse
SX
- -
2
de ( XY Xy) 2
su valor X 2
esperado
n X o prediccin a partir d

estima con
El Error Estndar o Error tpico de estimacin es
X
0
s =1Es lasvariacin
2
. Espromedio
el margen dede laerror
de arriba o debajo recta asociado pronsti
n = b0 + b1 X o Yj n= b0 + b1 X j

e
Y
Y = Y s = b0 + b1 X 2 s
La prediccin de Y es

Aproximamos e con e = Y - Y , o sea e j = Y j - Y j


Como b1 es una estimacin j del

j
verdadero j b
2
(Y - Y )
s se estima con 1 , tiene
(
2

j =1 de estimacin", j =1
s =S S= e =
2 bin
= =
un "error
2 n n cuyo cuadrado es
2 e (Ys-2Y ) (n - 1) S (1 - r )
2 2

n-2 n-2
j j j 2 2
j =1 j =1
s = S e =
2 2
=n = , as
Y XY
n - 2 que el Error Estndar de esti
b1 , que viene a ser
n-2 n 2- 2
- nX
2
Xj
la distancia promedio al cuadrado entre un valor real
la distancia promedio
de Y y su valor X al
j =1 esperado o prediccin a partir de

El Error Estndar o Error tpico de estimacin


2 es
s s 2
GRFICAMENTE, SE VERA AS
EST-203 ESTADISTICA II
AJUSTE DEL MODELO
que elige como estimaciones de b 0 y b 1 a aquellos valores
Ar tur o Calder n G. 2010 7

b0 y b1 que minimizan la suma de los errores al cuadrado,


n n

o sea a aquellos que minimizan SCE = e = (Y - a - b X )


j =1
2

El ajuste del modelo se refiere a medir que tan bien son representados los datos por el modelo
j
j =1
j j
2

manifestado mediante la ecuacin de la regresin.


1.4 Ajuste del Modelo
Se cuantifica el ajuste con la PROPORCIN DE VARIABILIDAD EN Y QUE SE PUEDE ATRIBUIR A X
Ajuste del model se refiere a medir qu tan bien son
representados los datos por el modelo. Siguiendo un en-
Ejemplo:
foqueQue tanto porcentaje de
explicativo, sela variabilidad
cuantifica de performance acadmico
el ajuste con de los
la alumnos
pro- de
psicologa
porcin es explicado por su Growth Mindset
de variabilidad en Y que se puede atribuir a X:

A partir de (Y j - Y ) = (Y j - Y ) + (Y j - Yj ) se puede demostrar

(Y ) ( )
n n n

(Y j - Y ) = - + -
2 2 2
j Y Y j Y j
que j =1 j =1 j =1
1 4243 1 4243 1 4243
Variabilidad total en Y Variabilidad debida a X Variabilidad residual


Donde
(Y - YYj) es=SCT=Suma
j =1
j el puntaje real por
2
de ejemplo en performance;
cuadrados totalY (con sombrero) es el modelo
1 que
42predijo
43
Variabilidad total en Y
el modelo de regresin e Y (con rayita) es el puntaje obtenido por la muestra

(Y -Y)
n
2
j =SCR=Suma de cuadrados de la regresin
que
(Y - Y )
j =1
j = (Y
j =1
- Y ) + (Y j - Yj )
j
j =1
ENTONCES
14243
Variabilidad total en Y
1 4243 1 4243
Variabilidad debida a X Variabilidad residu


j =1
(Y j - Y ) 2
=SCT=Suma detotales
SCT: Suma de cuadrados cuadrados total
1 4243
Variabilidad total en Y

(Y j - Y ) =SCR=Suma
n

2
de
SCR: Suma de cuadrados de la cuadrados
Regresin de la regre
j =1
1 4243
Variabilidad debida a X

(Y )
n
-
Y SCT: Suma de cuadrados
2
=SCE=Suma de Residual o del error
cuadrados residual o d
j j
j =1
1 4243
Variabilidad residual

Se escribe entonces SCT = SCR + SCE y se de

El Coeficiente de Determinacin R 2
Se escribe entonces SCT = SCR + SCEComo (Y j - Y )( X j - X ) = rXY
y se define:
(Y j - a -EL
b XCOEFICIENTE
j ) 2
DE DETERMINACIN
j =1
El Coeficiente de Determinacin R 2 n
r
SCR = b 1 (Y j - Y )( X j - X ) =

(Y -Y)
n
2 j =1

SCR j =1
j
Variabilid ad en Y generada
2 porSCR
X
2
rXY ( n - 1) S Y2
R = = = R = = = rXY
2
2

( n - 1) S Y
n

son j
SCT Variabilid ad total en Y SCT 2
tan bien (Y - Y ) 2

j =1
uiendo R 2un en- terpretacin del coefi
mide la proporcin de la variabilidad total en Y que es " explicada" o
con laatribuible
pro- a las diferencias en la variable cin
independiente de
X avarianza
travs de la de
regre- Y compar
Entonces, en el ejemplo de Growth mindset y rendimiento acadmico en estadstica
atribuir
sin. a laX:
Es
El R cuadradoproporcin de diferencias
medira la proporcin en Y que
de la variabilidad de dependencia, rXY Xes. proporci
totalse
dedeben a las
rendimiento diferencias
acadmico en
2
en
estadstica
que es explicada por la variable independiente2 Growth Mindset medida con la prueba de Dweck.
Equivalentemente,
El R cuadrado sera la proporcin de 100
la cantidad R %enesY (Growth
diferencias el porcentaje
LaMindsetdeque
relacinvariabilidad a las(por permite ap
anterior
se deben
diferencias en los promedios acadmicos de los alumnos en estadstica.
Y explicada
extensin, tambin se dice " % de la varianza" ) degrande, por el modelo.
mediano o pequeo: Se
ede demostrar
2 Adems como SCE = SCT - S
0
izquierdo Ejemplo
la 4 (Regresinen
desarrollaremos linea
est
BilateralCONTRASTES DE B1 En tarea
la el caso
ycedimiento
dedel estudioen
buscarla
Glass). Regression de S
de l
tabla t(k=n-2)
EST-203 ESTADISTICA II
defecto Aro default,10 segn l
tur o Calder n G. 2010

eba t-Student, no
Hiptesis Hiptesis Contraste
Rechazar
Tipo dede coeficiente
contraste
Nula
argamos al lector
Alterna HAnalize
0 si Regression Linear
Contrastar b H 0 : 1 = 0 equiv
Unilateral
(libro de Stanley H1 : b1 > 0 > t1- a
t Independent(s):Estres
derecho
(X)
H 0 : b1 = 0 X t < - t1-. El estadstico
Unilateral de con
H1 : b1 < 0 a
izquierdo
H1 : b1 0 | t |> t1- a / 2 Bilateral*
el
Cuadro procedimiento
1 Model Summary
t1- a y t1-a / 2 percentiles 1 - a y 1 - a / 2 de la tabla t(k=n-2)
para rec
* SPSS realiza este contraste
en la tabla anterior haci
Y no depende de R Adjusted
rXY SY
emente t = b
Adems
/
dad",
1 S bel
se deduce
y
que,
1 coeficiente
si bien "correlacin
Model
Nota:
de Pearson s puede ComoRno
usarse
b
es 1 =
causali-
Squar
para ex- y esSquare
1 .506(a)
plorar la posibilidad de pasar a un anlisis de regresin
S
e.256 X
mismo descrito
pues basta fijarse en el cuadrado aa Predictors:
del rXY(Constant),
otro, yentonces
ver si Escala
es de estrs (X)
su- el contr
ficientemente grande. En Psicologa no es frecuente en-
l En el caso del estudio de Howell et al, aplicando el pro-
-2) cedimiento Regression de SPSS, con las opciones por

ent, no
EJEMPLO DE SIMULACIN
defecto o default, segn la secuencia:

lector
Stanley DESEMPEO ACADMICO Y GROWTH
Regression
Analize Linear
Independent(s):Estres (X)
Dependent:Sntomas (Y)

OK. Obtenemos tres cuadros:

MINDSET Cuadro 1 Model Summary

Std. Error
nde de R Adjusted R of the
Model R Squar Square Estimate
1 / S b 1 y
1 .506(a) e.256 .249 17.562
EST-203 ESTADISTICA II Ar tur o Calder n G. 2010 11
rito a Predictors: (Constant), Escala de estrs (X)

R = Cor r elacin de Pear son (en valor absoluto)


b
entr e X e Y=0.506 que es
gr ande segn Cohen ANOVA
iente Sum of
te
Std. Er r or of the Estimate
Model = Err or df
Squares Tpico de Square de Y F= Sigma Sig.
Estimacin
Mean
1 Regression 11148.382 1 11148.382 36.145 .000a
Residual 32386.048 105 308.439
=0 y
Total 43534.430 106
a. Predictors: (Constant), Escala de estrs (X)
b. Dependent Variable: Sntomas Hopkins (Y)
EST-203 ESTADISTICA II Ar tur o Calder n G. 2010 12

Cuadro 3 Coefficients a

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 73.890 3.271 22.587 .000
Growth M.
ESTRES .783 .130 .506 6.012 .000
a. Dependent Variable: SINTOMAS

Coeficiente de la constante= Constant = b0 =73.890

Coeficiente de X (ESTRS) = ESTRS= b1 =0.783. Std. Err or = E.E. del


r espectivo coeficiente.

EEb1 = Sb1 = 0.130 (E.E. de Beta 1) o sea b 1 = 0 . 783 0 . 130 o


AHORA, USTEDES

QUE FU LO QUE SALI CON SU


DATA?

Potrebbero piacerti anche