Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
library(MASS, pos=17)
data(UScereal, package="MASS")
#Previamente... las variables han de estar relacionadas-->
Matriz de correlación
cor(UScereal[,c("calories","carbo","fat","fibre","potassium","pr
otein","sodium","sugars")], use="complete")
#Primera prueba: generar un modelo con todas las variables
LinearModel.1 <- lm(calories ~ carbo + fat + fibre + potassium +
protein + sodium + sugars, data=UScereal)
summary(LinearModel.1)
#call=Llamada
#Residuals=Residuos generadas
#Coefficients=Coeeficientes del modelo --> Bi
#El modelo sería
calorias=Y=INTERCEPT+4.88carbo+9.31fat+2.78fibre-
0.113potassium+4.83protein+0.0115sodium+4.55sugars
#VALORES INFLUYENTES
#Añadimos residuos estunderizados, valores de Hat y distancias
de Cook
showData(UScereal, placement='-20+200',
font=getRcmdr('logFont'), maxwidth=80, maxheight=30)
showData(UScereal_GN, placement='-20+200',
font=getRcmdr('logFont'), maxwidth=80, maxheight=30)
UScereal_GN_GGP<- within(UScereal_GN_GGP, {
rstudent.LinearModel.3 <- rstudent(LinearModel.3)
hatvalues.LinearModel.3 <- hatvalues(LinearModel.3)
cooks.distance.LinearModel.3 <- cooks.distance(LinearModel.3)
})
Boxplot( ~ rstudent.LinearModel.3, data=UScereal_GN_GGP,
id.method="y") ##A)Diagrama cajas y bigotes
##B) Gráficas básicas de diagnóstico: Cook deja residuos grandes
por arriba y por abajo y los que estén situados en esas badnas
son influyentes.
oldpar <- par(oma=c(0,0,3,0), mfrow=c(2,2))
plot(LinearModel.3)
par(oldpar)
##C) Modelos-->Gráficas--> Gráficas de influencia : El radio-
hat=potencial=influencia
#También sale la comprobación numérica que simboliza los
anómalos y más inluyentes
influencePlot(LinearModel.3, id.method="noteworthy", id.n=2) #Ea
#ALEATORIDAD
#a) Representación de residuos en GRÁFICAS BÁSICAS DE DIAG:
Comportamiento aleatorio=independencia, comportamiento con
patrón=dependencia
#b) Test de Durbin-Watson: Ho: Independientes (lo ideal) H1:
Dependientes
#OJO! QUE BUSCAMOS LA INDEPENDENCIA!
library(zoo, pos=19)
library(lmtest, pos=19)
dwtest(calories ~ carbo + fat + fibre + potassium + protein +
sodium + sugars, alternative="two.sided", data=UScereal_GN_GGP)
Grado en Ciencias Mar y Ambientales Estadística Aplicada
Universidad de Cádiz Isabel Alarcón Carrasco
Curso 2015/16
#NORMALIADAD
#a) Gráficas Q-Q de Gráficas Básicas de Diagnóstico.
#b) Test de Shapiro-Wilk. Ho: Normalida, H1: No normalidad
with(UScereal_GN_GGP,
shapiro.test(UScereal_GN_GGP$residuals.LinearModel.3))