Sei sulla pagina 1di 6

Estadstica Aplicada

Tema XIII

1) Una compaa de seguros considera que el nmero de vehculos accidentados


semanalmente en una determinada autopista se puede relacionar con la densidad del
trfico observado en ese mismo periodo. Para comprobarlo escogi cinco semanas al
azar y obtuvo los siguientes resultados:
Densidad de trfico (X)
(miles de vehculos diarios)
Vehculos accidentados (Y)

15
5

18
7

10
2

8
1

20
9

A) Calcula la recta de regresin del nmero de vehculos accidentados sobre la

densidad de trfico.
B) Somete a contraste la pendiente de la recta de regresin muestral obtenida.
SOLUCIN
A)
Obtenemos los coeficientes de la recta de regresin muestral

a y bx

Cov ( x, y )

xi x y i y

x = 14,20

i 1

x y
i 1

donde:

Cov ( x, y )
s x2

De los datos del enunciado se obtiene que


n

y i a b xi

nx y

y = 4,8

n=5

15 5 18 7 .... 20 9 5 14,20 4,8


5

=
= 13,64
Y la varianza de

s x2

2
xi x
i 1

x
i 1

2
i

nx2

15 2 18 2 .... 20 2 5 4,8 2 = 20,96


5

Por tanto tenemos

b=

13,64
20,96 = 0,651

a = 4,8 0,651 14,20 = - 4,44

La ecuacin de la recta de regresin muestral es:

Escuela Universitaria de Ingeniera Tcnica Agrcola I.N.E.A. (U. Valladolid)

Estadstica Aplicada

Tema XIII

y i a b xi = - 4,44 + 0,651 xi

De acuerdo con la anterior ecuacin, cada mil vehculos adicionales de trfico supondran un
incremento medio de 0,65 vehculos accidentados, en la previsin.
B)
La segunda parte del ejercicio pide que contrastemos la pendiente de la recta de regresin
muestral anterior.
Eso equivale a un contraste relativo a la pendiente de la verdadera recta de regresin
poblacional, en el que nos planteamos hasta que punto esa pendiente (a pesar de lo
obtenido con la recta de regresin muestral) es significativamente distinta de cero.
H0 : = 0

H1 : 0

Cuando la hiptesis nula es verdadera, la variable aleatoria


correspondiente al estadstico:
t

se comporta como una distribucin

b 0
b

t n2

t de Student con n 2

grados de libertad.

Consultando las tablas de esta distribucin, siendo el contraste bilateral, tres los grados de
libertad ( n - 2 = 3) y si tomamos = 0,05
RA = { -3,18 t 3,18 }
RC = { t -3,18 t 3,18 }
Con los datos del problema, obtenemos una estimacin de la varianza de los residuos.

x
15
18
10
8
20

y
5
7
2
1
9

SUMA TOTAL

5,321
7,273
2,067
0,765
8,574

( y i y ) 2

0,1028
0,0745
0,0045
0,0551
0,1811
0,4180

(y
i 1

y ) 2

n2

Escuela Universitaria de Ingeniera Tcnica Agrcola I.N.E.A. (U. Valladolid)

0,4180
0,139
3

Estadstica Aplicada

Tema XIII

A continuacin se obtiene la estimacin de la varianza de la pendiente de la recta de


regresin muestral.


2
b

2
n

(x
i 1

x)2

0,139
104,80 = 0,0013

El valor 104,80 que aparece en la frmula viene del apartado A (numerador de la varianza
all calculada). Finalmente, el valor del estadstico de contraste:
b0
0,65 0

= 18,03
b
0,0013

Se rechaza la hiptesis nula: existe una dependencia lineal entre las dos variables.

2) Se tom una muestra de veinticinco empleados de una fbrica. Se solicit a cada


empleado de la muestra que evaluara la satisfaccin con su propio trabajo ( x ) en una
escala de 1 a 10. Adems se contaron los das de absentismo laboral ( y) durante el
ltimo ao para estos empleados. Con estos datos se obtuvo por mnimos cuadrados la
recta de regresin muestral
y i 13,6 1,2 x i

Adems se obtuvo la varianza de la variable explicativa y la suma de los cuadrados del


error SCE
25

SCE ( y i y i ) 2 80,6

Var ( x ) s x2 5,20

i 1

Contrasta la hiptesis de que la


satisfaccin con
el trabajo no tiene efecto lineal sobre el absentismo, a un nivel de significacin de 0,01
SOLUCIN
Lo que nos piden equivale a un contraste sobre la pendiente de la recta de regresin lineal.
Establecemos como hiptesis nula que esta pendiente es igual a cero.
H0 : = 0
H1 : 0

Siendo verdadera la hiptesis nula, tendramos:


t

b 0
b

t n2

Por tanto, para un nivel de significacin de 0,01 en contraste bilateral, siendo 23 los grados
de libertad resulta:

Escuela Universitaria de Ingeniera Tcnica Agrcola I.N.E.A. (U. Valladolid)

Estadstica Aplicada

Tema XIII

t / 2 = 2,81

y por tanto:

RA = { -2,81 t 2,81 }

RC = { t -2,81 t 2,81 }
De los datos del enunciado obtenemos:
n

(y
i 1

y )

80,6 = 3,50
23

n2

Por tanto:


2
b

luego:

2
n

(x
i 1

x)2

3,50
5,20 25 = 0,027

b0
1,2 0

= 7,31 por lo que se rechaza la hiptesis nula.


b
0,027

En consecuencia, la satisfaccin con el trabajo tiene un efecto lineal sobre el absentismo.

3) En una muestra de seis brandys diferentes se analiz el contenido de aldehidos y de


steres de cada uno, obtenindose los resultados
Aldehidos (x)
steres (y)

9,8

8,9

7,3

6,3

6,6

10,3

31,7

32,3

8,5

14,3

14,0

17,8

A) Ajusta por mnimos cuadrados una recta de regresin muestral, tomando el

contenido de aldehido como variable explicativa.


B) Calcula el coeficiente de determinacin.

SOLUCIN
A)
Obrenemos los diversos estadsticos muestrales que vamos a necesitar.

x = 8,20

y = 19,77

s x2

x
i 1

y
i 1

n
n

s y2

x
i 1

n
n

nx2

2
i

y
i 1

2
i

9,8 2 8,9 2 .... 10,3 2 6 8,20 2 = 2,41


6

n y2
n

31,7 2 32,3 2 .... 17,8 2 6 19,77 2 = 82,24


6

Escuela Universitaria de Ingeniera Tcnica Agrcola I.N.E.A. (U. Valladolid)

Estadstica Aplicada

Tema XIII

Aunque la varianza de la variable dependiente slo la utilizaremos en el apartado B del


problema.
Finalmente la covarianza.
n

Cov ( x, y )

x y
i 1

nx y

9,8 31,7 8,9 32,3 .... 10,3 17,8 6 8,20 19,77


6

= 8,91
Para obtener la recta de regresin podemos aplicar las frmulas vistas en el ejercicio
nmero uno, o bien, directamente, sustituir en la expresin:

y i y

Cov ( x, y )
( xi x )
s x2

Hacindolo, queda:
y i 19,77

8,91
( xi 8,20)
2,41

y en expresin resumida:

y i 10,55 3,70 xi

El contenido en ster del brandy crece linealmente al aumentar los contenidos de aldehido,
siendo la razn o proporcin de ese crecimiento 3,70 (pendiente de la recta)
B)
Se nos pide calcular el coeficiente de determinacin. Tenemos:
n

(y
i 1

i 1

i 1

2
2

2
i y ) ( yi y ) ( yi yi )

expresin cuyos trminos reciben el

nombre:

Variacin total = Variacin explicada + Variacin no explicada


El coeficiente de determinacin viene dado por :
n

V . explicada
r2
i n1
V . total

( y i y ) 2

(y
i 1

y)2

o, de manera equivalente:

Escuela Universitaria de Ingeniera Tcnica Agrcola I.N.E.A. (U. Valladolid)

Estadstica Aplicada

Tema XIII

r2

( y i y ) 2
i 1
n

(y
i 1

( yi y ) 2 ( yi y i ) 2
i 1

y)2

i 1

(y
i 1

y)2

(y
i 1
n

(y
i 1

y i ) 2

y) 2

V . no explicada
V . total

Con esta ltima frmula vamos a obtener el coeficiente de determinacin.

x
9,8
8,9
7,3
6,3
6,6
10,3

y
31,7
32,3
8,5
14,3
14,0
17,8

25,71
22,38
16,46
12,76
13,87
27,56

SUMA TOTAL

( y i y ) 2

35,88
98,41
63,36
2,37
0,02
95,26
295,30

Por otra parte lo que hemos llamado variacin total no es otra cosa que el numerador de la
varianza de la variable dependiente, ya obtenida en el apartado A. As pues resulta:
n

V . no explicada
r2 1
1
V . total

(y
i 1
n

(y
i 1

y i ) 2

y)2

295,3
= 0,40
82,24 6

Y la ecuacin de la recta de regresin, obtenida por mnimos cuadrados, permite explicar


un 40% de la variabilidad observada en la variable dependiente.

Escuela Universitaria de Ingeniera Tcnica Agrcola I.N.E.A. (U. Valladolid)

Potrebbero piacerti anche