Sei sulla pagina 1di 34

Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M.

270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Presentazione del docente


Cari Studenti,
permettetemi di presentarmi. Sono Raoul Coccarda Docente di Statistica e Statistica Economica presso
l’Università eCampus di Novedrate.
I miei indirizzi e-mail sono:
raoul.coccarda@uniecampus.it; jacoccarda@libero.it
raoul.coccarda@gmail.com
Si ricorda agli studenti che in base alla comunicazione di segreteria del 12/12/2013, i docenti sono
contattabili attraverso il sistema di messaggistica della piattaforma.
Per quanto riguarda l’orario di ricevimento telefonico esso è stabilito il mercoledì dalle ore 18 alle ore 19;
per quanto riguarda quello nell’aula virtuale esso è stabilito il mercoledì dalle ore 17 alle ore 18. Faccio
presente che nel corso dei ricevimenti settimanali affronterò i seguenti temi: frequenze e distribuzioni di
valori in classi; indici di tendenza centrale, di variabilità; di forma, di concentrazione e di associazione;
teoria e calcolo delle probabilità; variabili casuali discrete e continue; distribuzioni di probabilità di v.c.
discrete binomiale e poissoniana; distribuzioni di probabilità di v.c. continue normale e normale
standardizzata, t di student, Chi-quadrato e F di Fisher; p-value; modello di regressione lineare semplice
e relativa inferenza
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Contenuti dell'Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Obiettivi dell’Insegnamento
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Obiettivi dell’Insegnamento

3. Con riferimento all’autonomia di giudizio lo studente di Statistica deve acquisire:


a. autonomia di giudizio nel settore della rilevazione e rappresentazione quantitativa
dei dati;
b. autonomia di giudizio nella gestione del software R

4. Con riferimento alle abilità comunicativa lo studente di Statistica dovrà:


a. aver fatto propri adeguate competenze per la gestione e la comunicazione
dell'informazione, sia agli specialisti che ai non specialisti, sui contenuti basilari della
Statistica;
b. essere in grado di utilizzare, in forma scritta e orale, almeno una lingua
dell’Unione Europea oltre l’italiano, con riferimento anche al lessico disciplinare.

5. Con riferimento all’abilità ad apprendere lo studente di Statistica dovrà:


a. acquisire una formazione di aula virtuale nella quale saprà personalizzare
casi concreti con il software R utilizzando dati reali
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Modalità di svolgimento esame

a) 21 domande a risposta chiusa (con punteggio 0 per risposta errata o non data e 1
per risposta corretta) e 3 a risposta aperta (con punteggio massimo di 3 punti ciascuna);
la lode sarà a discrezione della Commissione;
b) il Docente potrà invitare lo studente che ha raggiunto una valutazione maggiore o
uguale a 16/30 ad integrare la votazione attraverso un esame orale da svolgersi per via
telematica nella propria sede, nel corso della stessa sessione di esame, in giorni
successivi alla prova scritta;
c) resta ferma la possibilità di integrare la valutazione, superiore o uguale a 16/30, con
esame orale in presenza, nelle sedi di Roma ovvero Novedrate nella sessione di esame
successiva.

N.B. a seguito di indicazioni da parte del MIUR in ordine alla necessaria verifica della
qualità dell’apprendimento, si comunica che a partire dal nuovo a.a. ogni studente potrà
effettuare un massimo di 2 prenotazioni d’esame a sessione.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Metodi di accertamento dei risultati di apprendimento e modalità di


valutazione

• Con riferimento alle conoscenze e capacità di comprensione l’esame finale valuterà


l’acquisizione da parte dello studente delle nozioni fondamentali relative a:
- alla rilevazione dei dati, alle distribuzioni di frequenza e relative rappresentazioni
grafiche e alle classi;
- agli indici di posizione centrale, di variabilità, di forma, di concentrazione e di
connessione e associazione;
- alla teoria e calcolo delle probabilità;
- alle variabili casuali discrete e continue e relative distribuzioni di probabilità notevoli;
- alla teoria dei campioni e della stima;
- alla verifica di ipotesi, ai test parametrici, agli errori di I e II tipo e alla potenza del
test, alla tecnica dei p-value
- al Modello di regressione lineare semplice
- all’inferenza statistica sul modello di regressione lineare semplice
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Metodi di accertamento dei risultati di apprendimento e modalità di


valutazione
Con riferimento all’applicazione delle conoscenze e capacità acquisite l’esame finale
valuterà la capacità dello studente di collegare i diversi temi trattati e la capacità di
risolvere dei semplici quesiti ed esercizi di argomento statistico.
• Con riferimento alle abilità comunicative, l’esame finale valuterà, oltre ai contenuti
delle risposte, anche la capacità di utilizzare con appropriatezza i termini del linguaggio
scientifico e di esporre efficacemente gli argomenti studiati.

Le risposte alle domande aperte vengono valutate su scala 0-3 punti, secondo i seguenti
criteri:
• 0 = risposta mancante o errata;
• 1 = prevalere complessivo di elementi non corretti con isolati spunti corretti;
• 2 = contestualizzazione della risposta corretta, ma con presenza di elementi non
corretti o esposta in modo non efficace o incompleto;
• 3 = risposta corretta, ben esposta

Le risposte alle domande chiuse vengono valutate su una scala 0/1.

Nella prova scritta non è prevista l’attribuzione di penalità alle risposte errate.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Propedeuticita’, Bibliografia e Sussidi Didattici


Propedeuticità: lo studente deve possedere le conoscenze matematiche di base.
Deve saper usare il computer e conoscere in modo elementare il software R.
Bibliografia: Libro di Testo obbligatorio
R. Coccarda, L. Panetta (2018) Compendio di Statistica con R, EBSLibri
Testo solo consigliato e del tutto facoltativo
R. Coccarda (2011), Manuale di Statistica, Maggioli Editore
Sussidi didattici presenti sulla piattaforma dell’eCampus :
• Prove di esame tipo con soluzione

• Quiz composti da domande a risposta multipla

• Videolezioni

• Paniere
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Propedeuticita’, Bibliografia e Sussidi Didattici


Altri sussidi didattici al di fuori della piattaforma dell’eCampus:
Anche se non riconosciuto dall’ANVUR si inserisce come sussidio didattico l’interattività con il sito
www.didatticainterattiva.it. Si fa presente, infatti, che:
1. l’obbligatorietà del libro di testo è legata al fatto che in esso sono contenute le parti
propedeutiche alle risposte sulle domande a risposta multipla e aperte riguardanti il software R che
costituiscono una parte considerevole della prova di esame a cui il Docente associa una grande
importanza. E che tali contenuti non sono riportati nelle slides in quanto lo Studente, con questa
innovativa didattica interattiva ha un percorso di studio molto più facilitato a costi ridotti. L’acquisto
del libro di testo, che può essere fatto solo attraverso il sito di cui sopra, è legato al fatto che lo
studente riceverà, previa registrazione, le credenziali che gli permetteranno di disporre degli scripts in
formato pdf. Con la Nuova Edizione del Compendio lo studente potrà disporre, inoltre, di un RCode di
accesso ad una piattaforma di R attraverso la quale potrà gestire gli script anche con smatphone e
tablet;
2. con il percorso didattico sopradescritto lo Studente potrà verificare la conoscenza degli
argomenti di Statistica mandando in esecuzione gli stessi script che potrà personalizzare con propri
dati. Ciò gli permette di accorciare e di controllare il percorso conoscenza-applicazione e al contempo
acquisire un primo livello di competenze nella gestione di un software statistico, che oltre ad essere
libero, e non è poco, è uno di quelli più utilizzati nel panorama statistico e non;
3. lo Studente, oltre ai servizi erogati dall’Università eCampus, potrà disporre di un Servizio
dedicato da parte del Docente in qualità di Direttore Scientifico nell’omonima Rubrica del sito.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Attivita’ Didattica Erogativa e Integrativa

Le attività di Didattica Erogativa riguardano le videolezioni, le slides in Power Point e i


seminari.
Le attività di Didattica Interattiva riguardano test di autovalutazione a risposta multipla
con feedback automatico presenti in piattaforma (Funzione EPPI: Compila).

Nella didattica interattiva sono inoltre previsti interventi dello studente nel forum
dell’insegnamento dove è possibile rispondere a quesiti e partecipare alla raccolta di
materiale aggiuntivo per lo studio disponibile in rete (video e articoli scientifici, esercizi
online, etc).

Durante l’anno verranno tenute dalla docente e dai Tutor Disciplinari lezioni ed
esercitazioni in aula virtuale, i Tutor OnLine avranno a disposizione il calendario con giorni
e orari.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Consigli del Docente

Consiglio di leggere attentamente la presente scheda corso

Consiglio di studiare attentamente il Compendio di Statistica con R soprattutto ai fini della


preparazione sulle domande a risposta multipla e aperta riguardanti il software R

Consiglio di utilizzare tutti i sussidi didattici presenti in piattaforma

Consiglio di dotarsi obbligatoriamente del libro di testo

Consiglio di tener in conto quanto descritto nella Sezione sussidi didattici in modo
particolare per quanto riguarda le credenziali che il sito concede gratuitamente a Voi
studenti su richiesta del Direttore scientifico Prof. Coccarda Raoul e che permettono la
gestione e soprattutto la personalizzazione degli script di R anche in modalità mobile con
smart-phone e tablet
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Software R
Il software R è una insieme integrato di strumenti software per la elaborazione dei dati, il
calcolo e la grafica. Dispone, tra le altre cose, di un efficace sistema di gestione e
memorizzazione dei dati; di un insieme di operatori per i calcoli, in particolare sulle
matrici; di una grande, coerente e integrata raccolta di strumenti intermedi per l'analisi
dei dati; di strutture grafiche per l'analisi dei dati e visualizzazione direttamente sul
computer o su carta.
Dispone, altresì, di un linguaggio di programmazione ben sviluppato, semplice ed efficace
(chiamato 'S') che include condizionamenti, cicli, funzioni ricorsive definite dall'utente e
strutture di input e output (infatti la maggior parte delle funzioni fornite dal sistema sono
scritte nel linguaggio S). R è un veicolo per i nuovi metodi di analisi dei dati interattivi.
Esso si è sviluppato rapidamente ed ha una vasta collezione di pacchetti.
Dal punto di vista storico R può essere considerato come un'implementazione del
linguaggio S sviluppato presso i Laboratori Bell da Rick Becker,da John Chambers e da
Allan Wilks, e costituisce anche la base dei sistemi S-Plus.
Per R il riferimento di base è la nuova lingua S che può essere considerato un ambiente
di programmazione per l'analisi dei dati e per la grafica.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Struttura dell’ambiente di R
Si ritiene opportuno iniziare con i comandi di aiuto in R che possono essere: qt; help(qt);
help.start (); help.search ("covarianza"). Con il primo si fornisce al comando la sua descrizione, il suo
utilizzo e la sua funzionalità; con il secondo si visualizza un menu di opzioni di aiuto; con il terzo si
avvia il comando di aiuto; con il quarto si cerca nei le di aiuto la parola o la frase data come
argomento.
Molte volte, però, il miglior aiuto disponibile può essere trovato da una ricerca online.
Per cercare nel Sito Web R funzioni e riferimenti, ad esempio "Filtro di Kalman" utilizzare la seguente
linea di codice: RSiteSearch ("Filtro di Kalman").
I risultati della ricerca vengono evidenziati nel browser web.
Nell'ambiente R sono implementate le moderne tecniche statistiche. Alcune nell'ambiente base ma
molte altre sono fornite come pacchetti. Sono circa 25 i pacchetti forniti con R (chiamati "standard" e
"consigliati") e molti altri sono disponibili tramite il CRAN del sito Internet (https://CRAN.R-
project.org) e altrove. La maggior parte delle statistiche classiche e gran parte delle metodologie più
recenti sono disponibili ed utilizzabili attraverso l'ambiente di R, previa una piccola ricerca. C’è una
differenza importante tra R e gli altri principali sistemi statistici. In R un'analisi statistica è
normalmente fatta come una serie di passaggi, con i risultati intermedi che vengono memorizzati negli
oggetti.
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Struttura dell’ambiente di R
Mentre SAS e SPSS danno un output più articolato, ad esempio svolgendo un'analisi di
regressione, R si limita a dare un output essenziale e compatto privilegiando la memorizzazione di
oggetti adatti per interrogazioni successive attraverso le sue ulteriori funzioni. Si tratta, come detto
sopra, di un linguaggio di programmazione libero.
Fondamentalmente R è un pacchetto statistico che permette di elaborare dati, eseguire calcoli dai più
semplici ai più complessi, ottenere rappresentazioni grafiche e molto altro ancora. Il software R è un
punto di riferimento per tutto ciò che riguarda le analisi statistiche; ma è anche e soprattutto un
linguaggio di programmazione che è in grado di creare istruzioni personalizzate utilizzando l'apposita
R Console. Rende l'Utente indipendente da una costosa licenza software. Il programma di installazione
R può essere scaricato liberamente dal sito http://www.r-project.org La maggior parte delle funzioni a
cui si può essere interessati sono disponibili attraverso le librerie (a volte chiamate pacchetti) presenti
sul sito Web R.
Per scaricare ed installare una libreria, che non viene fornita con l'installazione standard,
occorre seguire il link CRAN sopra riportato dove si trova un elenco di librerie compresse
pronte per il download. Per installare un pacchetto si clicca su "Installa pacchetto" dalla directory
locale sotto il menu del pacchetto stesso. Quindi si seleziona il file scaricato ed il pacchetto sarà
disponibile per l'uso in futuro. Se si sta usando R sotto linux si installano nuove librerie attraverso il
seguente comando da digitare sul prompt: "R CMD INSTALL nome pacchetto".
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Utilizzo interattivo di R
Si può interagire direttamente con R attraverso il suo prompt dei comandi.
Sotto Windows il prompt di imput nella R Console normalmente è di colore rosso mentre
l'output restituito è di colore blu preceduto dal numero progressivo tra parentesi quadre.
Si noti che R è "case sensitive" per cui è importante, ad esempio, utilizzare sempre il
punto e mai la virgola per la parte decimale dei numeri; chiudere sempre le parentesi e
controllare che siano inserite correttamente.
I file degli script hanno generalmente l'estensione ".R
Per caricare uno script chiamato "vendite.R" si deve usare il comando:
source ("vendite.R")
Le linee di codice (script) possono essere inserite o direttamente nel prompt della
Rconsole oppure utilizzando la tendina "File", posta in alto sulla barra delle opzioni.
cliccando su "Nuovo script" si possono copiare e incollare se lo si vuole importare
dall'interno. Se invece si vuole utilizzare uno script dall’interno si clicca sull’opzione "Apri
file"
In entrami i casi si apre "Senza titolo-Editor di R".
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Utilizzo interattivo di R
Se nessun file è specificato R assume che lo stesso si trovi nella directory di lavoro
corrente. Molto importante è settare la directory di lavoro giusta quando si vuole
importare uno script dall'esterno.
Essa può essere visualizzata o modificata cliccando sulla RConsole e aprire da File
l'opzione "Cambia directory" oppure tramite il comando di R:
getwd ()
Per settare una nuova directory si può usare il comando:
setwd()
Poiche ogni comando usato e una funzione memorizzata in una delle librerie, si ha la
necessita di caricare le librerie prima di lavorare.
Molte delle funzioni comuni si trovano nelle librerie, che vengono caricate da predefinito
(di default).
Per accedere a qualsiasi altra funzione, tuttavia, si deve caricare la libreria appropriata
come prima riga di codice.
Ad esempio library(labstatR)

Per saperne di più utilizza il seguente link: http://www.didatticainterattiva.it/r.html


Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Importazione dei dati in R


Per importare dei dati su R è necessario scegliere il tipo di file che si vuole importare e
allo stesso tempo si debbono analizzare tre elementi:
1. l'estensione del file;
2. la prima riga che può contenere o meno i nomi delle variabili;
3. i separatori come la virgola, il punto e le parentesi.
Le funzioni base per importare i dati su R sono in particolare tre, e possono essere
utilizzate per importare dei dati in formati quali .csv, .tsv o .txt. Si tratta delle funzioni
read.table(), read.csv() e read.delim().\\
Se il file che si vuole leggere si chiama prova.txt (contenente vettori colonna di dati senza
il nome della colonna nella prima riga) che si trova nella directory mydat del disco C:/ il
codice da utilizzare è:
prova <- scan(«C:/mydat/prova.txt")

Se il file che si vuole leggere contiene, invece, il nome della colonne nella prima riga il
codice è:
prova <- read.table(“C:/mydat/prova.txt", header=TRUE, row.names=1)
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Importazione dei dati in R


Dopo aver stabilito i codici per l’importazione dei file in formato testo si prendono in considerazione
quelli in formato Excel. E' opportuno ricordare che il file origine Excel deve essere salvato con
l’estensione .csv oppure .csv2.Se il file prova.csv (salvato con una versione italiana di Excel, vale a
dire come separatore decimale la virgola) contiene due e più colonne con nome delle colonne nella
prima riga il comando da utilizzare è il seguente:
prova <- read.csv2(«C:/mydat/prova.csv", header=TRUE)
Se nella prima colonna ci sono i nomi di riga il comando è:
prova <- read.csv2(«C:/mydat/prova.csv", header=TRUE, row.names=1)
Se il file prova.csv è stato salvato con la versione inglese di Excel, vale a dire come separatore
decimale, il comando è:
prova <- read.csv(«C:/mydat/prova.csv", header=TRUE)} \\
Se nella prima colonna ci sono i nomi di riga il comando può essere anche il seguente:\\
prova <- read.csv(«C:/mydat/prova.csv", header=TRUE, row.names=1)
Per importare un data frame dal Cran di R, ad esempio «airquality», per rendere autonome le
colonne,
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1
Titolo: INTRODUZIONE AL CORSO LEZIONE TEORICA
Attività n°: 1

Importazione dei dati in R


Per importare un data frame dal Cran di R, ad esempio «airquality», per rendere
autonome le colonne, per sostituire nella colonna corrispondente alla v.c. «Ozone» i
valori mancanti (NA) con 0 e quindi calcolare la relativa media (altrimenti impossibile da
calcolare), per calcolare la media di un’altra colonna , ad esempio quella corrispondente
alla v.c. «Temp», per rappresentarne il relativo box-plot, per attaccare di nuovo le
colonne, le linee di codice sono:

data.frame(airquality)
attach(airquality)
omit
x(is.not(NA))<-0
mean(Ozone)
mean(Temp)
detach(airquality)
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1

Laboratorio studio guidato


Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1

Laboratorio studio guidato


PASSO SECONDO. L'inserimento della "i" è necessario in quanto il puntatore deve passare
tutti gli oggetti specificati dopo il comando "in" uno alla volta.

CASO 2. Dati i valori delle vendite x (1,2,3,4,5) e della produzione y(10,11,12,13,14)


individuare le linee di codice di R per rappresentare i seguenti grafici:
 grafico a barre verticali (istogramma);
 grafico a dispersione;
 grafico a barre cumulato del vettore (y);
 grafico a torta

PASSO PRIMO.
Le linee di codice per il grafico a barre verticali (istogramma) per il carattere x sono:
x<-c(1,2,3,4,5)
par(bg="cornsilk")
hist(x)
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1

Laboratorio studio guidato


Il software R restituisce il seguente grafico.

Vendite
2.0
1.5
Frequency

1.0
0.5
0.0

1 2 3 4 5

x
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1

Laboratorio studio guidato


Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1

Laboratorio studio guidato


Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S1
Titolo: LABORATORIO STUDIO GUIDATO
Attività n°: 1

Laboratorio studio guidato


PASSO QUARTO.
Le linee di codice per il grafico a torta per il carattere y sono:
y<-c(10,11,12,13,14)
par(bg="cornsilk")
pie(table(y))
Il software R restituisce il seguente grafico.

11

10

12

14

13
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S2
Titolo: LABORATORIO CASI SVOLTI
Attività n°: 1

Laboratorio casi svolti. Caso 1

Nel Laboratorio casi svolti il lettore trova casi concreti elaborati con soluzioni che
perm ettono di rafforzare l’applicazione e che, com e per il Laboratorio studio
guidato, sviluppano un percorso che dalla conoscenza conduce alla com petenza.
N.B. Questo testo non viene ripetuto nelle Lezioni successive

CASO 1. Si consideri che il vettore a assuma i valori 1,2,3 e il vettore b i valori 4,6,8.
Quali sono le linee di codice di R: a) per trasformare i valori dei vettori riga in valori dei
vettori colonna e viceversa; b) per convertire un vettore in una matrice 1xN; c) per
costruire un data frame utilizzando la procedura «tab»; d) per costruire un data frame
utilizzando il comando «matrix»
SOLUZIONE
a) cbind (a, b); rbind (a, b) ; b) as.matrix ()
c) tab <- matrix(c(1:18),6, 3);rownames(tab) <- c(a,b,c,d,e,f)
colnames(tab) <- c("Ottimo", "Buono", "Discreto")
tab
d) m1<- matrix(1:36, nrow=6)
df<-data.frame(m1); df
Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S2
Titolo: LABORATORIO CASI SVOLTI
Attività n°: 1

Laboratorio casi svolti. Caso 1


CASO 1. Si consideri il data frame prova.txt e la directory mydat .
Quali linee di codice si utilizzano: a) per importarlo in R senza il nome della colonna nella
prima riga; b) quando contiene due e più colonne separate da spazi vuoti con nome delle
colonne nella prima riga; c) se nella prima colonna ci sono i nomi di riga.

Soluzione

a) prova <- scan("c:/mydat/prova.txt")

b) prova <- read.table("c:/mydat/prova.txt", header=TRUE)

c) prova <- read.table("c:/mydat/prova.txt", header=TRUE, row.names=1)


Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S2
Titolo: LABORATORIO CASI SVOLTI
Attività n°: 1

Laboratorio casi svolti. Caso 1


CASO 1. Si disponga di una serie di dati suddivisi per riga, dove si trovano le osservazioni,
e per colonna, dove si trovano le variabili. Il data frame relativo viene salvato sulla
directory mydat con la versione italiana di Excel, vale a dire come separatore decimale la
virgola con l’estensione .csv o csv2 , quindi si ha il data frame prova.csv o prova.csv2
Quali linee di codice si utilizzano: a) per importarlo in R senza il nome della colonna nella
prima riga; b) quando contiene due e più colonne separate da spazi vuoti con nome delle
colonne nella prima riga; c) con la versione di Excel in inglese se nella prima colonna
non ci sono i nomi di riga; ; d) con la versione di Excel in inglese se nella prima colonna
ci sono i nomi di riga
Soluzione
a) prova <- read.csv2("c:/mydat/prova.csv", header=TRUE)

b) prova <- read.csv2("c:/mydat/prova.csv", header=TRUE, row.names=1)

c) prova <- read.csv("c:/mydat/prova.csv", header=TRUE)

d) prova <- read.csv("c:/mydat/prova.csv", header=TRUE, row.names=1)


Corso di Laurea: ECONOMIA - CURR. ECONOMIA (D.M. 270/04)
Insegnamento: STATISTICA
Lezione n°: 1/S2
Titolo: LABORATORIO CASI SVOLTI
Attività n°: 1

Laboratorio Casi da svolgere. Casi 1 e 2

Nel Laboratorio casi da svolgere il lettore si deve dom andare se è in


grado di risolvere i casi proposti. Se la risposta è afferm ativa passi allo
studio del Capitolo successivo. Se la risposta è negativa allora ritorni
alla Lezione teorica e quindi al Laboratorio Studio guidato e Casi svolti.
N.B. Questo testo non viene ripetuto nelle Lezioni successive

CASO 1. Si consideri che il vettore a assuma i valori 1,2,3 e il vettore b i valori 4,6,8.
Quali sono le linee di codice di R: a) per trasformare i valori dei vettori riga in valori dei
vettori colonna e viceversa; b) per convertire un vettore in una matrice 1xN; c) per
costruire un data frame utilizzando la procedura «tab»; d) per costruire un data frame
utilizzando il comando «matrix». Riportare gli output di R nonché svolgere con propri dati
le stesse operazioni.
CASO 2. Si consideri il data frame prova.txt e la directory mydat .
Quali linee di codice si utilizzano: a) per importarlo in R senza il nome della colonna nella
prima riga; b) quando contiene due e più colonne separate da spazi vuoti con nome delle
colonne nella prima riga; c) se nella prima colonna ci sono i nomi di riga. Riportare gli
output di R nonché svolgere con propri dati le stesse operazioni.

Potrebbero piacerti anche