Sei sulla pagina 1di 12

Compendios

Ejercicio 1
Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen
a un lago, se toman medidas de la concentracin de nitrato en el agua. Para
monitorizar la variable se ha utilizado un antiguo mtodo manual. Se idea un
nuevo mtodo automtico. Si se pone de manifiesto una alta correlacin
positiva entre las medidas tomadas empleando los dos mtodos, entonces se
har uso habitual del mtodo automtico. Los datos obtenidos son los
siguientes:

Manual = X
Automtico = Y

25
30

40
80

120
150

75
80

150
200

300
350

270
240

400
320

450
470

575
583

Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es


apropiado, hallar la recta de regresin de Y sobre X y utilizarla para predecir la
lectura que se obtendra empleando la tcnica automtica con una muestra de
agua cuya lectura manual es de 100. Realizar el ejercicio en R

SOLUCION
Manual = X
25
40
120
75
150
300
270
400
450
575
2405

Automtico
=Y
30
80
150
80
200
350
240
320
470
583
2503

X2
625
1600
14400
5625
22500
90000
72900
160000
202500
330625
900775

XY

750
3200
18000
6000
30000
105000
64800
128000
211500
335225
902475

>
datos=read.table("agua.txt",
header=T)
> attach(datos)
> datos

> regresion<lm(y~x,data=datos)
> regresin

> summary(regresion)

x y
1 25 30
2 40 80
3 120 150
4 75 80
5 150 200
6 300 350
7 270 240
8 400 320
9 450 470
10 575 583
Call:
lm(formula = y ~ x, data = datos)
Coefficients:
(Intercept)
x
26.1150
0.9322
Call:
lm(formula = y ~ x, data = datos)
Residuals:
Min 1Q Median 3Q Max
-78.98 -18.57 14.31 23.53 44.24
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.11496 21.20188 1.232 0.253
x
0.93216 0.07064 13.195 1.04e-06 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
0.1 1

Residual standard error: 40.11 on 8 degrees of


freedom
Multiple R-squared: 0.9561, Adjusted Rsquared: 0.9506
F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e06
Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que
entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso
del modelo lineal para el problema

Y m X bn
Y=0.9(100)+26.11=116.11

Ejercicio 2
Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados de
diversos tamaos.
a. Cuntos cuadritos encierra cada

uno de los cuadrados dibujados?.

Represente esta variable mediante la letra N


b. Cunto mide el lado de cada cuadrado?. Represente esta variable
mediante la letra L
c. Coleccione su informacin en una tabla de datos.
d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.
Represente las parejas (L,N) en un plano cartesiano
e. Qu clase de curva obtiene?

Solucin

1
4
9
25
36
75

1
2
3
5
6
17

1
16
81
625
1296
2019

>
cuadrititos=read.table("cuadras.txt",head
er=T)
> attach(cuadrititos)
> cuadrititos
> regresion <- lm(L ~ N, data =
cuadrititos)
> summary(regresion)

NL
1
8
27
125
216
377

NL
1 11
2 42
3 93
4 25 5
5 36 6
Call:
lm(formula = L ~ N, data = cuadrititos)
Residuals:
1
2
3
4
5
-0.4895 0.1011 0.4188 0.2353 -0.2658
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.35302 0.28808 4.697 0.01826 *
N
0.13647 0.01434 9.519 0.00246 **
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.4287 on 3 degrees of freedom
Multiple R-squared: 0.968, Adjusted R-squared: 0.9573
F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459

> plot(cuadrititos)
> abline(lm(L~N))

Ejercicio 3
A partir de las siguientes observaciones para 5 aos de las variables X e Y,
ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:
Y: produccin nacional de un subsector industrial, en millones de toneladas.
X: tiempo

Ao

1995

1,25

1996

1997
3
Ejercicio 4

11,25

Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34
kilogramos respectivamente, entonces una nia de 12 aos pesara
aproximadamente:
A. 45
B. 55

C. 15
D. 51
E. 61
Ejercicio 5
En el anlisis de Regresin lineal se puede afirmar todo lo siguiente excepto:
A. Ajusta los datos a una lnea recta
B. Predice valores de una variable si se conoce el valor de la otra
C. Establece una relacin cuantitativa entre dos variables relacionadas
D. El mtodo grfico para determinar la relacin entre dos variables es ms
concreto que el mtodo matemtico o de mnimos cuadrados
E. Una relacin lineal entre dos variables queda representada por una lnea
recta llamada ecuacin de regresin
Ejercicio 6
Dado Los siguientes datos expuestos en la tabla
Edad

Estatura

60

80 100 110

5
112

La frmula de regresin para los datos propuestos est dada por:


A. y = 11,5x + 67,5

B. y = 7,5x + 85,5

D. y = 14,4x + 47

E. y = 14x + 48,8

Ejercicio 7

C. y = 13,4x + 52,2

El
Grafico para los puntos dispersos est dado por:
Rta:

Ejercicio 8
El diagrama de dispersin para la regresin lineal esta dado por

Rta:

Ejercicio 9
de Villavicencio. Determinar en R el grado de asimetra de los datos. Los
siguientes datos corresponden a 100 salarios tomados en una encuesta
aplicada a 380 habitantes establecer una conclusin.
289000

350000

886900

310000

650000

961200

320000

756000

1200000

345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000

320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100

750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100

1120000

310000

566700

900000

320000

690000

1000000

340000

789000

1700100

345000

310000

566700

936200

320000

690000

1025000

340000

789000

1700100

863000

310000

600000

942500

320000

699000

1025000

340000

800000

1700100

886000

320000

700000

1096000

320000

699000

1063000

340000

800000

1700100

345000

320000

700000

1116300

345000

859600

1777000

340000

800000

1700100

850000

320000

750000

1120000

345000

862300

1800000

345000

800000

1700100

1750000

>
salarios=c(289000,350000,886900,310000,650000,96120
0,320000,756000,1200000,345000,289000,350000,88900
0,320000,665500,965000,320000,756000,1300000,32000
0,289000,350000,890000,320000,689500,996000,320000
,759600,1700100,750000,289000,566700,896500,320000
,689500,999000,340000,759600,1700100,1120000,31000
0,566700,900000,320000,690000,1000000,340000,78900
0,1700100,345000,310000,566700,936200,320000,69000
0,1025000,340000,789000,1700100,863000,310000,6000
00,942500,320000,699000,1025000,340000,800000,1700
100,886000,320000,700000,1096000,320000,699000,106
3000,340000,800000,1700100,345000,320000,700000,11
16300,345000,859600,1777000,340000,800000,1700100,
850000,320000,750000,1120000,345000,862300,180000
0,345000,800000,1700100,1750000)
> par(mfrow=c(1,2))
> f=table(salarios)
> dd <- density(salarios)
> barplot(f)
> plot(dd,add=T)
> summary(salarios)

Min.

1st Qu. Median

Mean 3rd Qu.

Max.

289000 340000 700000 750900 947200 1800000

Esta es una asimetra positiva ya que

x > Me

Ejercicio 10
En una distribucin asimtrica negativa:
A
B
C
D
E

La moda se encuentra entre la media y la mediana


La moda est ubicada a la derecha de la media
La media es menor que la desviacin tpica
La media es menor que la mediana
La moda y la mediana son iguales

Ejercicio 11
Los momentos de segundo orden con respecto a la media de dos
distribuciones son 9 y 16, mientras que los momentos de tercer orden son 8.1 y
12. 8 respectivamente. La distribucin ms asimtrica es:
A
B
C
D

La primera porque tiene mayor grado de deformacin


La primera porque tiene menor grado de deformacin
La segunda porque tiene mayor grado de deformacin
La segunda porque tiene menor grado de deformacin

Ejercicio 12
Uno de los siguientes enunciados es verdadero
A La media en una muestra de datos agrupados la divide en dos partes.
B Una distribucin de datos permite calcular todas las medidas de
tendencia central
C La moda es un dato que permite analizar un resultado esperado
D Una medida de dispersin est libre del clculo de la media.
Ejercicio 13
En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto
A
B
C
D
E

Ajusta todos los datos a una lnea recta


Predice el valor de una variable si se conoce el valor de la otra
Establece una relacin cuantitativa entre dos variables
El mtodo grafico es ms concreto que el mtodo matemtico
Una relacin lineal de datos queda representada por una recta.

Ejercicio 14
Dado que el grado de asimetra de una distribucin es de 2,27, la media es de
189,87 y la mediana 189,16, entonces la varianza toma un valor
correspondiente a:
A
B
C
D
E

0.93
0.88
0.78
1.88
1.78

Ejercicio 15
Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo
que su media es igual a 3 y que la diferencia entre la media y la mediana es
igual a -2
A
B
C
D
E

2.9
0.9
19
9
1/9

Ejercicio 16
En la siguiente distribucin de datos el coeficiente de asimetra segn el
coeficiente de Pearson es:
Xi
f
A
B
C
D
E

2
1/3
3
1

Ejercicio 17

1
2

2
8

3
3

4
5

5
7

6
5

Retome los 100 datos y elabore una tabla en R para determinar el coeficiente
de Gini. Utilice la librera ineq, y compare los resultados. Establezca
conclusiones

289000

350000

886900

310000

650000

961200

320000

756000

1200000

345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000

320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100

750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100

1120000

310000

566700

900000

320000

690000

1000000

340000

789000

1700100

345000

310000

566700

936200

320000

690000

1025000

340000

789000

1700100

863000

310000

600000

942500

320000

699000

1025000

340000

800000

1700100

886000

320000

700000

1096000

320000

699000

1063000

340000

800000

1700100

345000

320000

700000

1116300

345000

859600

1777000

340000

800000

1700100

850000

320000

750000

1120000

345000

862300

1800000

345000

800000

1700100

1750000

> library(ineq)
>salarios=c(289000,350000,886900,310000,650000,96
1200,320000,756000,1200000,345000,289000,350000,
889000,320000,665500,965000,320000,756000,13000
00,320000,289000,350000,890000,320000,689500,996
000,320000,759600,1700100,750000,289000,566700,8
96500,320000,689500,999000,340000,759600,170010
0,1120000,310000,566700,900000,320000,690000,100
0000,340000,789000,1700100,345000,310000,566700,
936200,320000,690000,1025000,340000,789000,1700
100,863000,310000,600000,942500,320000,699000,10
25000,340000,800000,1700100,886000,320000,70000
0,1096000,320000,699000,1063000,340000,800000,17
00100,345000,320000,700000,1116300,345000,85960
0,1777000,340000,800000,1700100,850000,320000,75
0000,1120000,345000,862300,1800000,345000,80000
0,1700100,1750000)
> g=ineq(salarios,type="Gini")
>g
> plot(Lc(salarios),col="darkred",lwd=2)

[1] 0.3122976

Potrebbero piacerti anche