Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Regresión y correlación
BIOESTADÍSTICA
Lineal Curvilineal
●● ●
150
●● ●
● ●
●●
●●● ●
5000
● ●
●●
●●● ●●
●● ●●
100
● ●●●
●●●
●●● ● ●●
●● ●
3000
● ●●
y
y
●●●
● ●●
● ●●
● ●
50
●
● ● ●
●● ●●
●● ●●●●
0 1000
●● ●●
●● ● ●●●
● ● ●●
●●●●
●●●● ●● ●●● ●●
0
0 20 40 60 80 0 20 40 60 80
x x
● ●●
1.5
150
●●
●
●
●●
●● ● ●●●
●
● ●●
●
● ● ●●●
0.5
●
● ● ● ● ●●
100
● ●
● ● ● ●●●
●
● ● ● ●●● ●
● ●● ● ●●
●● ●
● ●
y
y
●
● ●● ●
● ● ●●●
● ●
−0.5
● ●
● ● ●
● ●
50
● ●
●
● ●●
● ●●
●●
−1.5
● ●●
●
●
● ● ●●●●
−2 −1 0 1 2 0 0 20 40 60 80
x x
80
● ●
70
70
Tasa de Mortalidad Infantil
60
● ●
50
50
● ●
40
40
30
30
● ●
● ●
20
20
● ●
1000 2000 3000 4000 5000 6000 1000 2000 3000 4000 5000 6000
PIB PIB
Variables:
1 X : Producto Interior Bruto
Recta de regresión:
Ŷ = aX + b, a y b son constantes
Objetivo: Obtener el valor de a y b
Método: mı́nimos cuadrados
Notación:
X1 = 700, ..., X7 = 4000
Y1 = 80.8, ..., Y7 = 16.22
Ŷ1 = a · 700 + b, ..., Ŷ7 = a · 4000 + b
Paises Tasa de Mortalidad Infantil PIB
Etiopı́a 80.8 700
.. .. ..
. . .
Georgia 16.22 4000
Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 10. Regresión y correlación 7 / 12
Regresión lineal simple
Método de mı́nimos cuadrados
Recta de regresión:
Ŷ = aX + b, a y b son constantes
Objetivo: Obtener el valor de a (pendiente de la recta) y b (punto de corte)
Queremos:
que Y y Ŷ sean lo más cercanos posibles
i.e., que (Y1 − Ŷ1 )2 + · · · + (Yn − Ŷn )2 sea lo más chico posible (en el
ejemplo n = 7)
i.e., encontrar a y b tal que
(Y1 − a · X1 − b)2 + · · · + (Yn − a · Xn − b)2 sea lo más chico posible
Calculando:
(X1 − X̄ ) · (Y1 − Ȳ ) + · · · + (Xn − X̄ ) · (Yn − Ȳ )
a :=
(X1 − X̄ )2 + · · · + (Xn − X̄ )2
b := Ȳ − a · X̄
Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 10. Regresión y correlación 8 / 12
Regresión lineal simple
Método de mı́nimos cuadrados
= −45144.8/3979000 = −0.01134577
b = 41.42667 + 0.01134577 · 3450 = 80.56958
(Ŷ1 − Ȳ )2 + · · · + (Ŷn − Ȳ )2
r2 =
(Y1 − Ȳ )2 + · · · + (Yn − Ȳ )2
r 2 ∈ [0, 1],
si r 2 está cerca de cero la relación lineal es baja
si r 2 está cerca de 1 es alta
Resultado
Si para cada X fijo, la variable Y tiene una distribución Normal de media
aX+b y desviación
p tı́pica constante, el estadı́stico
T := (n − 2) Var (X )asqrt(Ŷ1 − Yn )2 + · · · + (Ŷn − Yn )2 sigue una
distribución t de Student con n − 2 grados de libertad