Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADISTCA Y PROBABILIDADES
ESTADISTICA DESCRIPTIVA
Jos Antonio Poma
LIMA 24 DE SETIEMB
Regresin y correlacin
Independencia - Dependencia
Cuando se estudian dos caractersticas simultneamente sobre
una muestra, se puede considerar que una de ellas influye
sobre la otra de alguna manera. Por ejemplo la altura y el
peso o las horas de estudio y la calificacin en un examen.
El objetivo principal de la regresin es descubrir el modo en
que se relacionan.
Dos variables pueden considerarse:
Variables independientes No tienen relacin (una de ellas
no sirve para explicar los movimientos de la otra)
Dependencia funcional Y=f(x)
Dependencia estadstica
Independencia
estadstica
Dependenci
a estadstica
Dependencia funcional
y=a+
bx
Pendiente
Recta de regresin
yn
yi
yn 1
y3
u3
yi
y1
ui
yi
y2
Intercepto
x1
x2
x3
xn 1
xi
yi a bxi ui
xn
ui yi yi
Error
y i a bxi
La metodologa para la obtencin de la recta ser hacer MNIMA la suma de
los CUADRADOS de las perturbaciones. Por qu se elevan al cuadrado?
n
u ( yi yi ) 2
2
i
min u
q, p
i 1
2
i
2
u
i
i 1
(
y
y
)
i i
i 1
( yi y i ) yi a
q bpxi
i 1
i 1
y a bx y a bx
i
i 1
i 1
Errores cometidos al
aproximar por una recta
na
MINIMIZA
R
y b x
x y y bx x b x
y
x y
x bx nx b x
i i
y abx 0 y ab x
2 y a bx x 0 x y a x b x
2
i
i i
xi yi ynx b
S xy bSx2
2
i
i i
i i
2
i
2
a
a y bx
xi2 nx 2
S xy
S x2
y y
S xy
2
Sx
x x
Sy
x x
S xy
S y2
y y
S S
2
u
2
Ry
yi y i
N
2
Sy
2
Sx
Su2
R 1 2
SY
Su2
S y2
VR
VT y
Ayuda a determinar
la asociacin pero
en sentido inverso.
La mejor medida es
R.
rxy R
S xy S xy S xy
2
R bb'
S x2 S y2 S x S y
2
rxy
1 r 1
1 R 1 0 r 2 1 0 R2 1
S
Recta de regresin: yi y XY2
SX
y i y
S
S
x XY2 xi y XY2 xi x
SX
SX
S XY S X SY
S XY SY
SY
x
r
i
i
xi x
2
S X SY S X
S X SY S X
SX
r 1
Pendiente
R r R2 r 2
1 r 0
Negativa
r 0
Nula
0 r 1
r 1
Positiva
2
Y
Varianza total
Se descompone en:
Su2 S ry2 VR
S R2 SY2 Su2 VE
2
VR VE
S
S
S
S
2
R
1
R 1
VT VT
S
SY2
SY2
2
u
2
Y
2
Y
2
u
S S S
2
Y
2
R
2
u
VT VR VE
SIRVE PARA DETERMINAR SI EL AJUSTE HECHO ES BUENO. ES DECIR, SI LA VARIABLE X EXPLICA LAS
VARIACIONES DE LA VARIABLE Y. DEBER SER > 0.75
Prediccin
S XY
yi qa bpxi y 2 xi x
SX
Dado x0
estimar
S XY
y 0 aq bpx0 y 2
SX
y 0
x0 x
ESTADISTCA Y PROBABILIDADES