Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
# Esercizio 1
#===========================
set.seed(12345)
summary(X)
boxplot(X)
calcola_moda(X)
levels(X)[mediana]
#===========================
# Esercizio 2
#===========================
#----------------------------
# costruisco gli array della distribuzione in classi per ciascuna delle tre
sostanze
A_classi <- cut(concentrazioni_df$A, intervalli_A)
B_classi <- cut(concentrazioni_df$B, intervalli_B)
C_classi <- cut(concentrazioni_df$C, intervalli_C)
n <- length(A_mids)
var_A = var(A_mids) * (n-1)/n
var_A
# frequenze assolute
tabA <- table(A_classi)
tabA
# frequenze relative
fA <- tabA/sum(tabA)
fA
# cerco la classe per cui FA "attraversa" il valore 1/2 (ovvero la classe a cui
appartiene la mediana)
str(tabAB)
str(summary(tabAB))
attributes(summary(tabAB))
summary(tabAB)$n.vars
summary(tabAB)$n.cases
summary(tabAB)$statistic
summary(tabAC)$parameter
return(chi_stat/chi_max)
}
#===========================
# Esercizio 3
#===========================
set.seed(12345)
# grafico dei residui in funzione dei valori delle osservazioni della variabile X
plot(X, mYX$residuals)
abline(h=0)
# i residui non sembrano essere distribuiti casualmente intorno allo zero; i valori
negativi dei residui sono concentrati nella parte centrale dell'intervallo di
variazione della X (valori assoluti della X "piccoli"), mentre i valori positivi si
trovano agli estremi dell'intervallo (valori assoluti della X "grandi")
# il valore del quadrato del coefficiente di correlazione è molto vicino allo zero
=> il modello lineare non sembra essere un buon modello per spiegare la relazione
fra Y e X
# in questo contesto non sembra sensato utilizzare il modello per fare una
previsione
# genero il vettore Z
Z <- sqrt(Y)*sign(X)
plot(X, Z)
plot(X, Z)
abline(mZX)
# grafico dei residui in funzione dei valori delle osservazioni della variabile X
plot(X, mZX$residuals)
abline(h=0)
# i residui non sembrano avere un andamento sistematico in funzione della variabile
X, ma sembrano distribuiti "casualmente" intorno allo zero
# per valutare la bontà di adattamento da un punto di vista quantititativo,
guardiamo il quadrato del coefficiente di correlazione fra X e Z
cor(X, Z)^2
# il valore è molto elevato (> 0.7) => il modello lineare sembra essere un buon
modello; in questo contesto è sensato utilizzare il modello per effettuare una
previsione per il valore della Y in corrispondenza di un valore della X all'interno
dell'intervallo di variazione del campione