Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Obiettivi dell’Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Obiettivi dell’Insegnamento
a) 21 domande a risposta chiusa (con punteggio 0 per risposta errata o non data e 1
per risposta corretta) e 3 a risposta aperta (con punteggio massimo di 3 punti ciascuna);
la lode sarà a discrezione della Commissione;
b) il Docente potrà invitare lo studente che ha raggiunto una valutazione maggiore o
uguale a 16/30 ad integrare la votazione attraverso un esame orale da svolgersi per via
telematica nella propria sede, nel corso della stessa sessione di esame, in giorni
successivi alla prova scritta;
c) resta ferma la possibilità di integrare la valutazione, superiore o uguale a 16/30, con
esame orale in presenza, nelle sedi di Roma ovvero Novedrate nella sessione di esame
successiva.
N.B. a seguito di indicazioni da parte del MIUR in ordine alla necessaria verifica della
qualità dell’apprendimento, si comunica che a partire dal nuovo a.a. ogni studente potrà
effettuare un massimo di 2 prenotazioni d’esame a sessione.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Le risposte alle domande aperte vengono valutate su scala 0-3 punti, secondo i seguenti
criteri:
• 0 = risposta mancante o errata;
• 1 = prevalere complessivo di elementi non corretti con isolati spunti corretti;
• 2 = contestualizzazione della risposta corretta, ma con presenza di elementi non
corretti o esposta in modo non efficace o incompleto;
• 3 = risposta corretta, ben esposta
Nella prova scritta non è prevista l’attribuzione di penalità alle risposte errate.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
• Videolezioni
• Paniere
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Nella didattica interattiva sono inoltre previsti interventi dello studente nel forum
dell’insegnamento dove è possibile rispondere a quesiti e partecipare alla raccolta di
materiale aggiuntivo per lo studio disponibile in rete (video e articoli scientifici, esercizi
online, etc).
Durante l’anno verranno tenute dalla docente e dai Tutor Disciplinari lezioni ed
esercitazioni in aula virtuale, i Tutor OnLine avranno a disposizione il calendario con giorni
e orari.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Consiglio di tener in conto quanto descritto nella Sezione sussidi didattici in modo
particolare per quanto riguarda le credenziali che il sito concede gratuitamente a Voi
studenti su richiesta del Direttore scientifico Prof. Coccarda Raoul e che permettono la
gestione e soprattutto la personalizzazione degli script di R anche in modalità mobile con
smart-phone e tablet
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Software R
Il software R è una insieme integrato di strumenti software per la elaborazione dei dati, il
calcolo e la grafica. Dispone, tra le altre cose, di un efficace sistema di gestione e
memorizzazione dei dati; di un insieme di operatori per i calcoli, in particolare sulle
matrici; di una grande, coerente e integrata raccolta di strumenti intermedi per l'analisi
dei dati; di strutture grafiche per l'analisi dei dati e visualizzazione direttamente sul
computer o su carta.
Dispone, altresì, di un linguaggio di programmazione ben sviluppato, semplice ed efficace
(chiamato 'S') che include condizionamenti, cicli, funzioni ricorsive definite dall'utente e
strutture di input e output (infatti la maggior parte delle funzioni fornite dal sistema sono
scritte nel linguaggio S). R è un veicolo per i nuovi metodi di analisi dei dati interattivi.
Esso si è sviluppato rapidamente ed ha una vasta collezione di pacchetti.
Dal punto di vista storico R può essere considerato come un'implementazione del
linguaggio S sviluppato presso i Laboratori Bell da Rick Becker,da John Chambers e da
Allan Wilks, e costituisce anche la base dei sistemi S-Plus.
Per R il riferimento di base è la nuova lingua S che può essere considerato un ambiente
di programmazione per l'analisi dei dati e per la grafica.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Struttura dell’ambiente di R
Si ritiene opportuno iniziare con i comandi di aiuto in R che possono essere: qt; help(qt);
help.start (); help.search ("covarianza"). Con il primo si fornisce al comando la sua descrizione, il suo
utilizzo e la sua funzionalità; con il secondo si visualizza un menu di opzioni di aiuto; con il terzo si
avvia il comando di aiuto; con il quarto si cerca nei le di aiuto la parola o la frase data come
argomento.
Molte volte, però, il miglior aiuto disponibile può essere trovato da una ricerca online.
Per cercare nel Sito Web R funzioni e riferimenti, ad esempio "Filtro di Kalman" utilizzare la seguente
linea di codice: RSiteSearch ("Filtro di Kalman").
I risultati della ricerca vengono evidenziati nel browser web.
Nell'ambiente R sono implementate le moderne tecniche statistiche. Alcune nell'ambiente base ma
molte altre sono fornite come pacchetti. Sono circa 25 i pacchetti forniti con R (chiamati "standard" e
"consigliati") e molti altri sono disponibili tramite il CRAN del sito Internet (https://CRAN.R-
project.org) e altrove. La maggior parte delle statistiche classiche e gran parte delle metodologie più
recenti sono disponibili ed utilizzabili attraverso l'ambiente di R, previa una piccola ricerca. C’è una
differenza importante tra R e gli altri principali sistemi statistici. In R un'analisi statistica è
normalmente fatta come una serie di passaggi, con i risultati intermedi che vengono memorizzati negli
oggetti.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Struttura dell’ambiente di R
Mentre SAS e SPSS danno un output più articolato, ad esempio svolgendo un'analisi di
regressione, R si limita a dare un output essenziale e compatto privilegiando la memorizzazione di
oggetti adatti per interrogazioni successive attraverso le sue ulteriori funzioni. Si tratta, come detto
sopra, di un linguaggio di programmazione libero.
Fondamentalmente R è un pacchetto statistico che permette di elaborare dati, eseguire calcoli dai più
semplici ai più complessi, ottenere rappresentazioni grafiche e molto altro ancora. Il software R è un
punto di riferimento per tutto ciò che riguarda le analisi statistiche; ma è anche e soprattutto un
linguaggio di programmazione che è in grado di creare istruzioni personalizzate utilizzando l'apposita
R Console. Rende l'Utente indipendente da una costosa licenza software. Il programma di installazione
R può essere scaricato liberamente dal sito http://www.r-project.org La maggior parte delle funzioni a
cui si può essere interessati sono disponibili attraverso le librerie (a volte chiamate pacchetti) presenti
sul sito Web R.
Per scaricare ed installare una libreria, che non viene fornita con l'installazione standard,
occorre seguire il link CRAN sopra riportato dove si trova un elenco di librerie compresse
pronte per il download. Per installare un pacchetto si clicca su "Installa pacchetto" dalla directory
locale sotto il menu del pacchetto stesso. Quindi si seleziona il file scaricato ed il pacchetto sarà
disponibile per l'uso in futuro. Se si sta usando R sotto linux si installano nuove librerie attraverso il
seguente comando da digitare sul prompt: "R CMD INSTALL nome pacchetto".
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Utilizzo interattivo di R
Si può interagire direttamente con R attraverso il suo prompt dei comandi.
Sotto Windows il prompt di imput nella R Console normalmente è di colore rosso mentre
l'output restituito è di colore blu preceduto dal numero progressivo tra parentesi quadre.
Si noti che R è "case sensitive" per cui è importante, ad esempio, utilizzare sempre il
punto e mai la virgola per la parte decimale dei numeri; chiudere sempre le parentesi e
controllare che siano inserite correttamente.
I file degli script hanno generalmente l'estensione ".R
Per caricare uno script chiamato "vendite.R" si deve usare il comando:
source ("vendite.R")
Le linee di codice (script) possono essere inserite o direttamente nel prompt della
Rconsole oppure utilizzando la tendina "File", posta in alto sulla barra delle opzioni.
cliccando su "Nuovo script" si possono copiare e incollare se lo si vuole importare
dall'interno. Se invece si vuole utilizzare uno script dall’interno si clicca sull’opzione "Apri
file"
In entrami i casi si apre "Senza titolo-Editor di R".
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
Utilizzo interattivo di R
Se nessun file è specificato R assume che lo stesso si trovi nella directory di lavoro
corrente. Molto importante è settare la directory di lavoro giusta quando si vuole
importare uno script dall'esterno.
Essa può essere visualizzata o modificata cliccando sulla RConsole e aprire da File
l'opzione "Cambia directory" oppure tramite il comando di R:
getwd ()
Per settare una nuova directory si può usare il comando:
setwd()
Poiche ogni comando usato e una funzione memorizzata in una delle librerie, si ha la
necessita di caricare le librerie prima di lavorare.
Molte delle funzioni comuni si trovano nelle librerie, che vengono caricate da predefinito
(di default).
Per accedere a qualsiasi altra funzione, tuttavia, si deve caricare la libreria appropriata
come prima riga di codice.
Ad esempio library(labstatR)
Se il file che si vuole leggere contiene, invece, il nome della colonne nella prima riga il
codice è:
prova <- read.table(“C:/mydat/prova.txt", header=TRUE, row.names=1)
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1
data.frame(airquality)
attach(airquality)
omit
x(is.not(NA))<-0
mean(Ozone)
mean(Temp)
detach(airquality)
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1
PASSO PRIMO.
Le linee di codice per il grafico a barre verticali (istogramma) per il carattere x sono:
x<-c(1,2,3,4,5)
par(bg="cornsilk")
hist(x)
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1
Vendite
2.0
1.5
Frequency
1.0
0.5
0.0
1 2 3 4 5
x
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1
11
10
12
14
13
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S2
Titolo: LABORATORIO CASI SVOLTI
Attività n°: 1
Nel Laboratorio casi svolti il lettore trova casi concreti elaborati con soluzioni che
perm ettono di rafforzare l’applicazione e che, com e per il Laboratorio studio
guidato, sviluppano un percorso che dalla conoscenza conduce alla com petenza.
N.B. Questo testo non viene ripetuto nelle Lezioni successive
CASO 1. Si consideri che il vettore a assuma i valori 1,2,3 e il vettore b i valori 4,6,8.
Quali sono le linee di codice di R: a) per trasformare i valori dei vettori riga in valori dei
vettori colonna e viceversa; b) per convertire un vettore in una matrice 1xN; c) per
costruire un data frame utilizzando la procedura «tab»; d) per costruire un data frame
utilizzando il comando «matrix»
SOLUZIONE
a) cbind (a, b); rbind (a, b) ; b) as.matrix ()
c) tab <- matrix(c(1:18),6, 3);rownames(tab) <- c(a,b,c,d,e,f)
colnames(tab) <- c("Ottimo", "Buono", "Discreto")
tab
d) m1<- matrix(1:36, nrow=6)
df<-data.frame(m1); df
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S2
Titolo: LABORATORIO CASI SVOLTI
Attività n°: 1
Soluzione
CASO 1. Si consideri che il vettore a assuma i valori 1,2,3 e il vettore b i valori 4,6,8.
Quali sono le linee di codice di R: a) per trasformare i valori dei vettori riga in valori dei
vettori colonna e viceversa; b) per convertire un vettore in una matrice 1xN; c) per
costruire un data frame utilizzando la procedura «tab»; d) per costruire un data frame
utilizzando il comando «matrix». Riportare gli output di R nonché svolgere con propri dati
le stesse operazioni.
CASO 2. Si consideri il data frame prova.txt e la directory mydat .
Quali linee di codice si utilizzano: a) per importarlo in R senza il nome della colonna nella
prima riga; b) quando contiene due e più colonne separate da spazi vuoti con nome delle
colonne nella prima riga; c) se nella prima colonna ci sono i nomi di riga. Riportare gli
output di R nonché svolgere con propri dati le stesse operazioni.