Sei sulla pagina 1di 3

SOLUCION A LA PRACTICA 01 ESTADISTICA GENERAL ING.

CIVIL UNAP 2018-04-15


Para realizar un determinado experimento se he medido el tiempo en minutos en secar una pintura anti corrosión del
acero de una muestra de 40 casos, obteniéndose los siguientes datos:

12.2,12.9,11.8,11.9,11.6,11.1,12.3,12.2,11.8,11.8,10.7,11.5,11.3,11.2,11.6,11.9,13.3,11.2,10.5,11.1,12.1,11.9,10.4,10.7
,10.8,11.0,11.9,10.2,10.9,11.6,10.8,11.6,10.4,10.7,12.0,12.4,11.7,11.8,11.3,11.1

INGRESAMOS LOS DATOS EN R.

> t =c(12.2,12.9,11.8,11.9,11.6,11.1,12.3,12.2,11.8,11.8,10.7,11.5,11.3,11.2,11.6,11.9,13.3,11.2,10.5,11.1,
12.1,11.9,10.4, 10.7,10.8,11.0,11.9,10.2,10.9,11.6,10.8,11.6,10.4,10.7,12.0,12.4,11.7,11.8,11.3,11.1 )
>t
[1] 12.2 12.9 11.8 11.9 11.6 11.1 12.3 12.2 11.8 11.8 10.7 11.5 11.3 11.2 11.6
[16] 11.9 13.3 11.2 10.5 11.1 12.1 11.9 10.4 10.7 10.8 11.0 11.9 10.2 10.9 11.6
[31] 10.8 11.6 10.4 10.7 12.0 12.4 11.7 11.8 11.3 11.1
Se pide:
a) calcule la media aritmética, moda, mediana, la desviación típica y el coeficiente de variación, represéntelos en una
grafica de distribución de datos.(datos no agrupados)

> mt = mean(t)
> mt
[1] 11.48
> mdt = median(t)
> mdt
[1] 11.6
> dt = sd(t)
> dt
[1] 0.6917833
> cvt = st/mt*100
Error: object 'st' not found
> cvt = dt/mt*100
> cvt
[1] 6.025987

b) Agrupe los datos en intervalos con la amplitud que se considere más adecuada, calculando de nuevo los
estadígrafos anteriores y comparándolos con los resultados obtenidos a partir de los datos no agrupados. Dibuje el
histograma.
>hist(t,xlab="tiempo de secado",ylab="numero de casos",main="Histograma de T")

Ing. Nayer Tumi Figueroa.


Otros comandos de hist
>hist(t,nclas=4,xlab="tiempo de secado",ylab="numero de casos",main="Histograma de")
>hist(t,col=7,xlab="tiempo de secado",ylab="numero de casos",main="Histograma de")
> hist(t,col=7,xlab="tiempo de secado",ylab="numero de casos",main="Histograma de",
+ border=3)
> hist(t,col=7,border=5,plot=F)
hist(t,col=7,border=5)
> pm=c(10.25,10.75,11.25,11.75,12.25,12.75,13.25)
> pf=c(4,7,8,14,5,1,1)
> lines(pm,pf)
> lines(pm,pf,"b")

c) Obtenga el intervalo donde se encuentra el 40% central de la distribución de los datos, muéstrelo en el histograma.

> quantile(t,0.3)
30%
11.1
> quantile(t,0.7)
70%
11.83

d) Estudie la simetría y el apuntamiento de la distribución, utilice los datos agrupados o no justifique por que ha usado
uno u otro caso.

e) calcule el rango intercuartil, p20, p90, d8, q3, ubíquelos en la curva de distribución o el histograma, e intérprete los
resultados.

> summary(t)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.20 10.98 11.60 11.48 11.90 13.30
> ?quantile()
starting httpd help server ... done
> quantile(t,c(0.2,0.8,0.9))
20% 80% 90%
10.80 11.92 12.21
abline(v=c(10.8,11.92,12.21),col=2)

f) construya un grafico tallo hoja.

> stem(t)

The decimal point is at the |

10 | 244
10 | 5777889
11 | 01112233
11 | 56666788889999
12 | 012234
12 | 9
13 | 3

g) graficar un diagrama de cajas

Ing. Nayer Tumi Figueroa.


> boxplot(t,horizontal=T,main="grafico cajas de tiempo de secado",

+ col=5)

h) Se tiene otra medida de tendencia central llamada la media recortada definido como:

Por Ejemplo, la media recortada al 10 % es la media aritmética del 90 % central de los valores de la muestra. Es decir,
se eliminan el 10 % de los valores extremos (el 5 % de los valores mas altos y el 5 % de los más bajos) y se calcula la
media de los que quedan. Como la media aritmética, es una medida de tendencia central para variables cardinales que
tiene ventajas e inconvenientes. La mayor ventaja es que al eliminar el 10 % los valores extremos, en caso de que haya
valores atípicos, ´estos no influyen en su cálculo y en este sentido es mejor que la media. Sin embargo, eliminar
individuos también supone un inconveniente, porque sabemos que las muestras son más informativas cuanto más
grandes sean y eliminar datos supone una pérdida de conocimiento. Si se dispone de muchos datos, eliminar alguno
no es problema, pero si la muestra es pequeña, si puede serlo. Además, es menos operativa matemáticamente que la
media.

Conforme esta definición, calcule la media recortada al 20% y al 10% compare con la media y analice, cual seria mas
representativa??

> mean(t,trim=0.5)

[1] 11.6

> mean(t,trim=0.10)

[1] 11.4625

> mean(t)

[1] 11.48

> hist(t)

> abline(v=c(11.4625,11.48,11.6),col=3)

> hist(t,col=7,border=5,plot=F)
$breaks
[1] 10.0 10.5 11.0 11.5 12.0 12.5 13.0 13.5

$counts
[1] 4 7 8 14 5 1 1

$density
[1] 0.20 0.35 0.40 0.70 0.25 0.05 0.05

$mids
[1] 10.25 10.75 11.25 11.75 12.25 12.75 13.25

> kurtosis=function(x) {
+ m4=mean((x-mean(x))^4) > skewness=function(x) {
+ kurt=m4/(sd(x)^4)-3 + m3=mean((x-mean(x))^3)
+ kurt} + skew=m3/(sd(x)^3)
> kurtosis(t) + skew}
[1] -0.244466 > skewness(t)
[1] 0.2760928
Ing. Nayer Tumi Figueroa.