Sei sulla pagina 1di 9

ASIGNACIN REGRESIN Y CORRELACIN

1. Calcule las medidas de Tendencia Central de los siguientes datos:


3, 5, 6, 8, 8, 8, 9, 9, 10, 11
Sol. Media (Ma): Llamado tambin Promedio Aritmtico Media Aritmtica
Ma

3 5 6 8 8 8 9 9 10 11
7.70 Ma = 7.70
10

Mediana (Me): El valor mediano o mediana de un conjunto de valores es aquel

que tiene la propiedad de dividir al conjunto en 2 partes igualmente numerosas. Si


el nmero de elementos fuese impar se tomar el valor central como la mediana;
pero si el nmero de elementos fuese par hay dos elementos en el centro y como
mediana se tomar el promedio de ellos.
En nuestro caso para el problema el Nmero de elementos (n) es 10, entonces se
toma los dos nmeros centrales y se promedia.
Me

88
8 Me = 8.00
2

Moda (Mo): Es el valor que se presenta con mayor frecuencia en un grupo de datos,

a una distribucin que tiene una sola moda se le denomina unimodal. Si hubiese
ms de dos valores no adyacentes con frecuencias mximas similares la
distribucin es multimodal; bimodal, trimodal, etc. En el caso que no exista ningn
valor que se repita se dice que no existe moda, el sistema ser amodal.
En nuestro caso para el problema el valor que ms se repite es:
Mo = 8.00

2. Calcule las medidas de Dispersin de los datos anteriores:


3, 5, 6, 8, 8, 8, 9, 9, 10, 11
Sol. Rango: Es la diferencia entre el mayor y el menor valor de un conjunto de datos.
Rango 11 3 8

Rango = 8.00

Desviacin Media: Se conoce tambin como promedio de desviacin, para una

serie de N valores: x1 , x 2 , x 3 , x 4 , ...., x n ; puede calcularse a travs de la


siguiente expresin:
N

Desviacin media =

D.M .

X
j 1

Donde:
X :
X

media aritmtica
X

valor absoluto de las desviaciones de los Xj valores,


respecto de la media.

Sabemos: X = Ma = 7.70

D.M .

3 7.7 5 7.7 6 7.7 8 7.7 3 9 7.7 2 10 7.7 11 7.7


10

1.82

D.M. = 1.82

Varianza: Dado un conjunto de nmeros se define como varianza al cuadro de la

desviacin tpica.

X
N

S2

Sabemos: X = Ma = 7.70

j 1

2
2
2
2
2
2
2

3 7.7 5 7.7 6 7.7 8 7.7 3 9 7.7 2 10 7.7 11 7.7

10

S 2 52.1 10

S2 = 5.21

Desviacin Estndar:

La desviacin estndar se representa con S y se define

como.

X
N

j 1

Como tenemos el valor de S2 solo procederemos a sacar raz cuadrada a la


varianza.
S

S 2 5.21 2.283

S = 2.28

Coeficiente de Variacin: A la dispersin relativa se le conoce con el nombre de

coeficiente de variacin que se expresa como un porcentaje.


V

S
100%
X

Sabemos: X = Ma = 7.70
S = 2.28
V

2.28
100% 29.61
7.70

V = 29.61

3.

Los valores reducidos de lpidos en las heces se relacionan con valores reducidos de
energa. Calcule el coeficiente de correlacin del siguiente grupo de datos e interprete su
valor.
Sujeto

Lpidos fecales
(gramos/da)
10.0
11.0
9.9
9.8
15.5
5.0
10.7
13.0
13.8
16.7
3.2
4.0
6.0
8.9
9.1
4.1
17.0
22.2
2.9
5.0

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Energa fecal
(MJ/da)
2.1
1.1
1.1
0.9
0.7
0.4
1.0
1.5
1.2
1.4
1.0
0.5
0.9
0.8
0.6
0.5
1.2
1.1
0.9
1.0

Sol.Definicin:
En el contexto del anlisis de la regresin lineal simple el coeficiente de correlacin
establece una medida del grado de asociacin lineal entre la variable respuesta y la
variable predictora, concretamente entre la variable respuesta y la recta de regresin
estimada. Se define, a partir de los n pares de observaciones, mediante:
n

x
i 1

x
i 1

x yi y

x
2

y
i 1

A continuacin podremos observar un cuadro del cual obtendremos las sumatorias


pedidas para desarrollar el clculo del coeficiente de relacin.

Total
20

i 1

Lpidos Energa
Xi
Yi
Xi - x Yi - y (Xi - x)(Yi - y) (Xi - x) (Yi - y)
10.0
2.1
0.1
1.1
0.122
0.012
1.221
11.0
1.1
1.1
0.1
0.117
1.232
0.011
9.9
1.1
0.0
0.1
0.001
0.000
0.011
9.8
0.9
-0.1
-0.1
0.009
0.008
0.009
15.5
0.7
5.6
-0.3
-1.655
31.472
0.087
5.0
0.4
-4.9
-0.6
2.910
23.912
0.354
10.7
1.0
0.8
0.0
0.004
0.656
0.000
13.0
1.5
3.1
0.5
1.571
9.672
0.255
13.8
1.2
3.9
0.2
0.802
15.288
0.042
16.7
1.4
6.8
0.4
2.758
46.376
0.164
3.2
1.0
-6.7
0.0
-0.033
44.756
0.000
4.0
0.5
-5.9
-0.5
2.916
34.692
0.245
6.0
0.9
-3.9
-0.1
0.370
15.132
0.009
8.9
0.8
-1.0
-0.2
0.193
0.980
0.038
9.1
0.6
-0.8
-0.4
0.312
0.624
0.156
4.1
0.5
-5.8
-0.5
2.866
33.524
0.245
17.0
1.2
7.1
0.2
1.458
50.552
0.042
22.2
1.1
12.3
0.1
1.293
151.536
0.011
2.9
0.9
-7.0
-0.1
0.664
48.860
0.009
5.0
1.0
-4.9
0.0
-0.024
23.912
0.000
9.9
1.0
16.649
533.198
2.910

x yi y 16.649

20

x x
i 1

533.198

20

y
i 1

2.91

Luego ingresamos estos valores en la formula de correlacin:


16.649
16.649

0.423 Coeficiente Correlacin = 0.423


533.198 2.91 23.091 1.706

Interpretacin del r:

Valor de r de 0 a 0.25 implica que no existe correlacin entre ambas variables.

Valor de r de 0.25 a 0.50 implica una correlacin baja a moderada.

Valor de r de 0.50 a 0.75 implica correlacin moderada a buena.

Valor de r de 0.75 o mayor, implica una muy buena a excelente correlacin.

Estos rangos de valores se pueden extrapolar a correlaciones negativas tambin.

Por lo tanto podemos decir que para nuestro caso el Coeficiente de Correlacin, r = 0.42,
implica una correlacin baja (a moderada).

4.

Se desea predecir si el puntaje logrado con el examen preliminar (A) puede predecir el
puntaje logrado con un examen final (B). Represente el grfico de Dispersin respectivo.
Sujeto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Examen Preliminar (A)


28
25
24
28
25
25
24
21
25
29
27
18
24
29
27
21
27
17
28
20

Examen Final (B)


8
7
7
9
10
8
9
5
9
9
10
6
10
10
8
6
6
3
8
6

Sol.Si utilizamos un sistema de coordenadas cartesianas para representar la distribucin


bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de
dispersin, cuyo anlisis permite estudiar cualitativamente, la relacin entre ambas
variables tal como se ve en el Grfico 1. El siguiente paso, es la determinacin de la
dependencia funcional entre las dos variables x e y que mejor ajusta a la distribucin
bidimensional.
El grfico de Dispersin lo hallaremos mediante el ingreso de los datos a una hoja de
Excel, de donde exportaremos para poder visualizar los datos en el Grfico Examen A
vs. Examen B.

Grfico 1.
Grfico de Dispersin
11
10
9

Examen Final (B)

8
7
6
5
4
3
2
1
0
14

16

18

20

22

24

26

28

30

Examen Preliminar (A)

5. Determine el modelo de regresin lineal simple.


Sol.Se denomina regresin lineal cuando la funcin es lineal, es decir, requiere la
determinacin de dos parmetros: la pendiente y la ordenada en el origen de la recta de
regresin, y=ax+b. La regresin nos permite adems, determinar el grado de dependencia
de las series de valores X e Y, prediciendo el valor y estimado que se obtendra para un
valor x que no est en la distribucin.
Vamos a determinar la ecuacin de la recta que mejor ajusta a los datos representados en el
Grfico 1. En concreto queremos expresar mediante una relacin cmo depende una de
ellas (variable dependiente) de la otra (variable independiente). Normalmente se elige
como y la variable dependiente y como x la independiente

Luego procesando los datos podemos obtener las sumatorias respectivas para el clculo de
a y b, con n = 20.
Exam. A Exam. B
Xi
Yi
Xi * Yi
28
8
224
25
7
175
24
7
168
28
9
252
25
10
250
25
8
200
24
9
216
21
5
105
25
9
225
29
9
261
27
10
270
18
6
108
24
10
240
29
10
290
27
8
216
21
6
126
27
6
162
17
3
51
28
8
224
20
6
120
492
154
3883
20

xi 492
i 1

20

i 1

y i 154

20 3883 492 154


0.3929
20 12344 492 2

20

Xi
784
625
576
784
625
625
576
441
625
841
729
324
576
841
729
441
729
289
784
400
12344

x i y i 3883
i 1

20

x
i 1

12344

154 0.3929 492


1.9643
20

Por lo tanto el modelo de Regresin Lineal es: y 0.3929 x 1.9643


6. Como interpreta el coeficiente alfa (a)

2
i

Sol.El Coeficiente Alfa (a) indica la pendiente de la Recta de Regresin Lineal, la cual se
define como la divisin entre el Examen Final (B) y el Examen Preliminar (A); esta
pendiente es baja y positiva.
7. Como interpreta el coeficiente beta (b)
Sol.El Coeficiente Beta (b) indica el valor de la ordenada en el origen, es decir cuando x
(Examen Preliminar A) es cero (0).
8. Cual sera el puntaje probable de un alumno en el examen final (B) si en el examen de tipo
(A) obtuvo 25.
Sol.Como la frmula de regresin lineal es: y 0.3929 x 1.9643 y sabiendo que y
(Examen A) es la variable dependiente de x (Examen B) procedemos a reemplazar el
valor de 25 en x para hallar el Examen Final (B):
y 0.3929 25 1.9643

7.8582

Examen... final ... y 7.90

Potrebbero piacerti anche