Sei sulla pagina 1di 12

SOLUCION COMPENDIOS

Ejercicio 1
Para estudiar el efecto de las aguas residuales de las alcantarillas que
afluyen a un lago, se toman medidas de la concentracin de nitrato en el
agua. Para monitorizar la variable se ha utilizado un antiguo mtodo manual.

Se idea un nuevo mtodo automtico. Si se pone de manifiesto una alta


correlacin positiva entre las medidas tomadas empleando los dos mtodos,
entonces se har uso habitual del mtodo automtico. Los datos obtenidos
son los siguientes:

Manual = X

25 40 120 75 150

300 270 400 450 575

Automtico = Y 30 80 150 80 200 350 240 320 470 583

Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es


apropiado, hallar la recta de regresin de Y sobre X y utilizarla para
predecir la lectura que se obtendra empleando la tcnica automtica con
una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en
R
SOLUCION
Manual = X
25
40
120
75
150
300
270
400
450

Automtico =
Y
30
80
150
80
200
350
240
320
470

625
1600
14400
5625
22500
90000
72900
160000
202500

750
3200
18000
6000
30000
105000
64800
128000
211500

575
2405
> datos=read.table("agua.txt", header=T)
> attach(datos)
> datos

> regresion<-lm(y~x,data=datos)
> regresin

> summary(regresion)

583
2503

330625
900775

335225
902475

x y
1 25 30
2 40 80
3 120 150
4 75 80
5 150 200
6 300 350
7 270 240
8 400 320
9 450 470
10 575 583
Call:
lm(formula = y ~ x, data = datos)
Coefficients:
(Intercept)
x
26.1150
0.9322
Call:
lm(formula = y ~ x, data = datos)
Residuals:
Min 1Q Median 3Q Max
-78.98 -18.57 14.31 23.53 44.24
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.11496 21.20188 1.232 0.253
x
0.93216 0.07064 13.195 1.04e-06 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 40.11 on 8 degrees of freedom
Multiple R-squared: 0.9561, Adjusted R-squared: 0.9506
F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e-06

Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que


entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso del
modelo lineal para el problema

Y m X bn
Y=0.9(100)+26.11=116.11

Ejercicio 2
Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados
de diversos tamaos.
a. Cuntos cuadritos encierra cada

uno de los cuadrados dibujados?.

Represente esta variable mediante la letra N


b. Cunto mide el lado de cada cuadrado?. Represente esta variable
mediante la letra L
c. Coleccione su informacin en una tabla de datos.
d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.
Represente las parejas (L,N) en un plano cartesiano
e. Qu clase de curva obtiene?
SOLUCIN

1
4
9
25
36
75

1
2
3
5
6
17

>
cuadrititos=read.table("cuadras.txt",header=T
)
> attach(cuadrititos)
> cuadrititos
> regresion <- lm(L ~ N, data = cuadrititos)
> summary(regresion)

NL
1
16
81
625
1296
2019

1
8
27
125
216
377

NL
1 11
2 42
3 93
4 25 5
5 36 6
Call:
lm(formula = L ~ N, data = cuadrititos)
Residuals:
1
2
3
4
5
-0.4895 0.1011 0.4188 0.2353 -0.2658
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.35302 0.28808 4.697 0.01826 *
N
0.13647 0.01434 9.519 0.00246 **
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.4287 on 3 degrees of freedom
Multiple R-squared: 0.968,
Adjusted R-squared: 0.9573
F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459

> plot(cuadrititos)
> abline(lm(L~N))

Ejercicio 3

A partir de las siguientes observaciones para 5 aos de las variables X e Y,


ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:

Y: produccin nacional de un subsector industrial, en millones de toneladas.


X: tiempo

Ao

1995

1,25

1996

1997

11,25

1998

20

1999

30,5

Ejercicio 4
Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34
kilogramos respectivamente, entonces una nia de 12 aos pesara
aproximadamente:

A. 45
B. 55
C. 15
D. 51
E. 61

Ejercicio 5
En el anlisis de Regresin lineal se puede afirmar todo lo siguiente
excepto:

A. Ajusta los datos a una lnea recta

B. Predice valores de una variable si se conoce el valor de la otra


C. Establece una relacin cuantitativa entre dos variables relacionadas
D. El mtodo grfico para determinar la relacin entre dos variables es ms
concreto que el mtodo matemtico o de mnimos cuadrados
E. Una relacin lineal entre dos variables queda representada por una lnea
recta llamada ecuacin de regresin

Ejercicio 6
Dado Los siguientes datos expuestos en la tabla
Edad

Estatura

60

80 100 110

112

La frmula de regresin para los datos propuestos est dada por:


A. y = 11,5x + 67,5

B. y = 7,5x + 85,5

D. y = 14,4x + 47

E. y = 14x + 48,8

C. y = 13,4x + 52,2

Ejercicio 7
El Grafico para los puntos dispersos est dado por:
120

100

80

60

60

40

40

20

20
0
0

120

120

100

100

80

80

60

60

40

40

20

20

0
0

Rta:

100

80

120

Ejercicio 8
El diagrama de dispersin para la regresin lineal esta dado por
120

100

100
80
60

50

40
20

120

120

100

100

80

80

60

60

40

40

20

20

0
0

Rta:

Ejercicio 9
Los siguientes datos corresponden a 100 salarios tomados en una encuesta
aplicada a 380 habitantes de Villavicencio. Determinar en R el grado de
asimetra de los datos. establecer una conclusin.
289000

350000

886900

310000

650000

961200

320000

756000

1200000 345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000 320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100

750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100

1120000

310000

566700

900000

320000

690000

1000000 340000

789000

1700100

345000

310000

566700

936200

320000

690000

1025000 340000

789000

1700100

863000

310000

600000

942500

320000

699000

1025000 340000

800000

1700100

886000

320000

700000

1096000 320000

699000

1063000 340000

800000

1700100

345000

320000

700000

1116300

345000

859600

1777000 340000

800000

1700100

850000

320000

750000

1120000

345000

862300

1800000 345000

800000

1700100

1750000

>
salarios=c(289000,350000,886900,310000,650000,96
1200,320000,756000,1200000,345000,289000,35000
0,889000,320000,665500,965000,320000,756000,13
00000,320000,289000,350000,890000,320000,6895
00,996000,320000,759600,1700100,750000,289000,
566700,896500,320000,689500,999000,340000,759
600,1700100,1120000,310000,566700,900000,320000
,690000,1000000,340000,789000,1700100,345000,31
0000,566700,936200,320000,690000,1025000,3400
00,789000,1700100,863000,310000,600000,942500,3
20000,699000,1025000,340000,800000,1700100,886
000,320000,700000,1096000,320000,699000,106300
0,340000,800000,1700100,345000,320000,700000,11
16300,345000,859600,1777000,340000,800000,1700
100,850000,320000,750000,1120000,345000,862300,
1800000,345000,800000,1700100,1750000)
> par(mfrow=c(1,2))
> f=table(salarios)
> dd <- density(salarios)
> barplot(f)
> plot(dd,add=T)
> summary(salarios)

Min.

1st Qu. Median

Mean 3rd Qu.

Max.

289000 340000 700000 750900 947200 1800000

Esta es una asimetra positiva ya que


Ejercicio 10

En una distribucin asimtrica negativa:


A. La moda se encuentra entre la media y la mediana
B. La moda est ubicada a la derecha de la media

C. La media es menor que la desviacin tpica


D. La media es menor que la mediana
E. La moda y la mediana son iguales
Ejercicio 11
Los momentos de segundo orden con respecto a la media de dos
distribuciones son 9 y 16, mientras que los momentos de tercer orden son
8.1 y 12. 8 respectivamente. La distribucin ms asimtrica es:

A. La primera porque tiene mayor grado de deformacin


B. La primera porque tiene menor grado de deformacin
C. La segunda porque tiene mayor grado de deformacin
D. La segunda porque tiene menor grado de deformacin

Ejercicio 12
Uno de los siguientes enunciados es verdadero

A. La media en una muestra de datos agrupados la divide en dos partes.


B. Una distribucin de datos permite calcular todas las medidas de
tendencia central
C. La moda es un dato que permite analizar un resultado esperado
D. Una medida de dispersin est libre del clculo de la media.

Ejercicio 13
En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto
A. Ajusta todos los datos a una lnea recta
B. Predice el valor de una variable si se conoce el valor de la otra
C. Establece una relacin cuantitativa entre dos variables
D. El mtodo grafico es ms concreto que el mtodo matemtico

E. Una relacin lineal de datos queda representada por una recta.


Ejercicio 14
Dado que el grado de asimetra de una distribucin es de 2,27, la media es
de 189,87 y la mediana 189,16, entonces la varianza toma un valor
correspondiente a:
A. 0.93
B. 0.88
C. 0.78
D. 1.88
E. 1.78
Ejercicio 15
Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo
que su media es igual a 3 y que la diferencia entre la media y la mediana es
igual a -2
A. 2.9
B. 0.9
C. 19
D. 9
E. 1/9
Ejercicio 16
En la siguiente distribucin de datos el coeficiente de asimetra segn el
coeficiente de Pearson es:
Xi
f
A.
B. 2
C. 1/3
D. 3

1
2

2
8

3
3

4
5

5
7

6
5

E. 1
Ejercicio 17
Retome los 100 datos y elabore una tabla en R para determinar el
coeficiente de Gini. Utilice la librera ineq, y compare los resultados.
Establezca conclusiones

289000

350000

886900

310000

650000

961200

320000

756000

1200000 345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000 320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100

750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100

1120000

310000

566700

900000

320000

690000

1000000 340000

789000

1700100

345000

310000

566700

936200

320000

690000

1025000 340000

789000

1700100

863000

310000

600000

942500

320000

699000

1025000 340000

800000

1700100

886000

320000

700000

1096000 320000

699000

1063000 340000

800000

1700100

345000

320000

700000

1116300

345000

859600

1777000 340000

800000

1700100

850000

320000

750000

1120000

345000

862300

1800000 345000

800000

1700100

1750000

> library(ineq)
>salarios=c(289000,350000,886900,310000,65
0000,961200,320000,756000,1200000,34500
0,289000,350000,889000,320000,665500,96
5000,320000,756000,1300000,320000,28900
0,350000,890000,320000,689500,996000,32
0000,759600,1700100,750000,289000,56670
0,896500,320000,689500,999000,340000,75
9600,1700100,1120000,310000,566700,90000
0,320000,690000,1000000,340000,789000,17
00100,345000,310000,566700,936200,32000
0,690000,1025000,340000,789000,1700100,8
63000,310000,600000,942500,320000,69900
0,1025000,340000,800000,1700100,886000,3
20000,700000,1096000,320000,699000,1063
000,340000,800000,1700100,345000,320000,
700000,1116300,345000,859600,1777000,340
000,800000,1700100,850000,320000,750000,
1120000,345000,862300,1800000,345000,800
000,1700100,1750000)
> g=ineq(salarios,type="Gini")
>g

[1] 0.3122976

> plot(Lc(salarios),col="darkred",lwd=2)

Potrebbero piacerti anche