Sei sulla pagina 1di 2

Ejercicio para la primera prctica calificada de Estadstica para Ingeniera

(2017 II)

Los datos de la base ENB2012.csv, que se encuentra disponible en el campus virtual,


han sido tomados de A. Tsanas, A. Xifara: 'Accurate quantitative estimation of energy
performance of residential buildings using statistical machine learning tools', Energy
and Buildings, Vol. 49, pp. 560-567, (2012). Estos datos provienen de un diseo
experimental conducido por los autores en el cual se han analizado las siguientes 10
variables:
X1 Compacidad relativa (Relative compactness)
X2 rea de superficie (Surface area)
X3 rea de pared (Wall area)
X4 rea de techo (Roof area)
X5 Altura total (Overall height)
X6 Orientacin (Orientation)
X7 rea de acristalamiento (Glazing area)
X8 Distribucin de rea de acristalamiento (Glazing area distribution)
Y1 Carga de calefaccin (Heating load)
Y2 Carga de refrigeracin (Cooling load)

Los datos fueron simulados por los autores del artculo para estudiar el posible efecto
de las variables X1 a X8 sobre las variables respuesta Y1 y Y2. Puede leer las dos
primeras secciones del artculo para entender mejor el contexto del experimento
realizado. (El artculo tambin est disponible en el campus virtual).

Use R para realizar lo siguiente:

a) Importe los datos en R con el nombre de datos, con el comando

datos = read.csv(C:\ENB2012.csv) # Colocar la ruta del archivo

o tambin puede importar los datos usando:

datos = read.csv(file.choose())

en este ltimo caso debe buscar el archivo en el cuadro de dilogo.

b) Elabore la distribucin de frecuencias y grafique el histograma para la variable


Y1. Considere 8 intervalos de clase.
c) Elabore la distribucin de frecuencias y grafique el histograma para la variable
Y2. Considere 8 intervalos de clase.
d) Realice un histograma de la variable Y1 para cada uno de los dos niveles de la
variable X5 (niveles: 3.5 y 7). Considere 8 intervalos de clase.
Sugerencia: por ejemplo, para acceder a los datos de Y1 para el nivel X5 = 3.5
puede utilizar el siguente comando
datos$Y1[datos$X5==3.5]
e) Realice un histograma de la variable Y2 para cada uno de los dos niveles de la
variable X5 (niveles: 3.5 y 7). Considere 8 intervalos de clase.
f) Calcule todas las estadsticas descriptivas estudiadas en clase de la variable Y1
para cada nivel de X5.
g) Calcule todas las estadsticas descriptivas estudiadas en clase de la variable Y2
para cada nivel de X5.
h) Realice un diagrama de cajas para comparar la distribucin de la variable Y1 en
cada nivel de X5.
i) Realice un diagrama de cajas para comparar la distribucin de la variable Y2 en
cada nivel de X5.
j) Calcule todas las estadsticas descriptivas estudiadas en clase de la variable Y1
para cada nivel de X4.
k) Calcule todas las estadsticas descriptivas estudiadas en clase de la variable Y2
para cada nivel de X4.
l) Realice un diagrama de cajas para comparar la distribucin de la variable Y1 en
cada nivel de X4.
m) Realice un diagrama de cajas para comparar la distribucin de la variable Y2 en
cada nivel de X4.

El da de la primera prctica calificada cada alumno debe llevar impresos los


resultados de los anlisis anteriores para responder las preguntas que se hagan al
respecto.

Potrebbero piacerti anche