Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
trattare in modo analogo i vettori (colonne) del data frame: dim(genere) head(genere) tail(genere)
laboratorio in R first
vettore = my.vector <- c(18, 20, 19, 19)
matrice = my.matrix <- matrix(c(23, 22, 30, 24, 19, 26, 30, 30), nrow = 4, ncol = 2) cambiare nome alle colonne
= colnames(my.matrix) <- c("Stat", "Math") cambiare nome alle righe = rownames(my.matrix) <- c("Student1",
"Student2", "Student3", "Student4")
istogramma
(creare un istogramma, prima vettore, frequenza assoluta, b=a quante volte si sono ripetuti i numeri del vettore,
estremo superiore, istogramma) = altezza<-c(3,7,8,32,35,39,50,60) freq.ass<-c(1,6,4,9,12,2,7,8)
b<-rep(altezza,freq.ass) es<- c(4,1,24,3,4,11,10) hist(b,breaks = es ,xlab = "altezza", main =
"Istogramma") hist
ogiva
library(agricolae) data(growth) h<-graph.freq(growth$height,plot=FALSE) points<-
ogive.freq(h,col="red",frame=FALSE, xlab="Height", ylab="Freq cum rel", main="ogiva")
grafico a torta
require(MASS) table.smok<-table(survey$Smoke) cols<-c("darkblue","yellow","green","red")
se vogliamo aggiungere la legenda = legend(0.9, 1.0, cex = 0.8, legend=labs, fill = cols)
R2
lettura file di un questionario = library(readr) citation("readr")
manipolazione di dati
manipolare i dati = library(dplyr) ricordiamoci delle variabili e delle colonne del dataframe = names(qd)
str(qd)
si possono filtrare le righe in base a delle condizioni = filter(qd, Sex == "Male") == è un uguale logico
filter(qd, Sex == "Male" & Height > 170) uguale non logico
Possiamo definire una nuova variabile usando *mutate* definiamo Velocità come Distanza divisa per Travel_time
= qd3 <- mutate(qd, Velocità = Distanza / Tempo_di_percorso) qd3$Velocità
Unione di due dataframe = a <- data_frame(x1 = c("A", "B", "C"), x2 = c(1, 2, 3)) b <- data_frame(x1 = c("A", "B",
"D"), x3 = c(4, 5, 6))
Modifica di dati larghi in dati lunghi = library(readr) wide <- read_csv("wide_data.csv") wide
names(wide)
calcolo indici
Packages <- c("readxl", "pastecs", "psych", "modeest","goeveg","ggplot2","viridis")
internet<- read_excel("internet.xlsx")
range(internet$timespenthour) camp.var<-max(internet$timespenthour)-min(internet$timespenthour)
summary(internet$timespenthour) = fa tutto
per accedere alle colonne separatamente si può l’operatore $ = eta.df$sesso eta.df$peso eta.df$eta
si possono usare indici numerici = eta.df[,2] (consideriamo i valori della seconda colonna, senza considerare il
resto) eta.df[4,] (consideriamo i valori della quarta colonna, senza considerare il resto)
eta.df[2,2:3] (consideriamo i valori della seconda riga, dalla seconda alla terza colonna)
per selezionare solo alcune osservazioni(righe)ed eseguire analisi statistiche solo su una parte del datafreme =
eta.piu27.df<-subset(eta.df, eta>27) eta.piu27.df