Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2016 / 2017
Laboratorio
del corso di
STATISTICA
Donata Bonino
Parte I:
capire la filosofia del SAS; primi passi con i dati
2
Il software SAS
Il SAS mette a disposizione un ambiente che consente input, manipolazioni,
analisi, report, memorizzazione dei risultati e creazione di file SAS,
compatibilmente con standard internazionali, quali ISO o IEEE.
Il SAS Institute e’ stato fondato nel 1976 a Raleigh, N.C.
SAS e’ un acronimo di “Statistical Analysis System”
Questo software è nato come un semplice linguaggio statistico ma si è evoluto
negli anni e ora offre soluzioni per:
• analisi statistiche classiche,
• data warehousing: ambiente con strutture dati finalizzate al supporto delle
decisioni,
• data mining: l'estrazione di informazione utile, eseguita in modo automatico o
semiautomatico, da grandi quantità di dati,
• visualizzazione di dati,
• sviluppo di applicazioni personalizzate. http://www.sas.com/
5
Strumenti applicativi
Noi utilizzeremo SAS Studio, di cui esiste una versione online ed una installata
in locale. In entrambi i casi l'ambiente di lavoro si presenta così:
6
Strumenti applicativi
7
La logica del SAS
• DATA STEP:
procedura di inserimento e manipolazione dati che porta alla
creazione di un Data Set SAS;
• PROC STEP:
procedura per elaborare il Data Set SAS (ad esempio per
effettuare analisi statistiche)
8
Regole di base del linguaggio di
programmazione SAS
I comandi SAS:
*commento;
(cioè * all’inizio e ; alla fine del commento)
/*commento/
(cioè /* all’inizio e / alla fine del commento)
9
Creare ed eseguire un programma
SAS
I passi essenziali per sottomettere un programma SAS sono:
Ho concluso la procedura
11
Ottengo, nella finestra di LOG:
Tempo di calcolo:
l'istruzione si è conclusa
12
Per aumentare la leggibilità, possiamo aggiungere un = dopo il nome della
variabile, che verrà visualizzato:
data _null_;
Risposta = 1 + 1;
put Risposta=;
run;
13
Salvare su file
Se si vuole salvare il risultato della priocedure in una tabella (spreadsheet),
basta inserirne il nome nella prima istruzione.
data NomeFile;
Risposta = 1 + 1;
put Risposta;
run;
I nomi utilizzati per le tabelle possono iniziare con una lettera o con un
underscore e possono contenere lettere, numeri e underscores.
Il SAS non è case-sensitive ma l’utilizzo di lettere maiuscole è utile per
rendere i nomi più leggibili.
3. Eseguire l’analisi
4. Visualizzare i risultati
17
Librerie
Il SAS salva i dati in una cartella che viene chiamata “LIBRERIA”, e che è
un alias di riferimento a una o più cartelle dell’hard disk.
In automatico, all’avvio, il SAS genera una libreria temporanea che si
chiama “Work”, e che viene utilizzata in mancanza di ulteriori indicazioni.
Questa libreria è temporanea e pertanto viene svuotata e cancellata
ogni volta che si termina la sessione di SAS.
18
Librerie
Per creare una nuova libreria (1° modo):
Creiamo una nuova cartella, per esempio laboratorioSAS, in una cartella locale
(nota: in laboratorio, non su Y: non abbiamo permesso di scrittura!)
Esempio:
libname LibDo "/folders/myfolders/laboratorioSAS";
N.B. Non creo nuove cartelle sull’hard disk, ma solo la libreria SAS!
Inoltre, se ci sono già file SAS nella cartella, questi saranno disponibili
nella libreria (senza bisogno di importarli)
19
2) Cliccare sull’icona “cartelle sovrapposte” nella sezione Librerie
nome di
riferimento per
la libreria (Max
8 caratteri)
percorso per
la cartella cui
si riferisce la
libreria
Per riavviare automaticamente una libreria all’avvio del SAS basta includere il
comando libname all’inizio del programma che utilizza i dati contenuti nella
libreria, oppure cliccare su “Ricrea all'avvio”.
20
Opzioni della proc libname
Possiamo specificare varie opzioni per le librerie:
libname LibDo v9 “/folders/myfolders/laboratorioSAS” access=readonly;
Una libreria può anche fare riferimento a più cartelle distinte sul disco fisso:
libname Libprova v9 ("/folders/myfolders/laboratorioSAS"
"/folders/myfolders/Articoli")
La libreria Libprova contiene ora tutti i file delle due cartelle!
21
Importare i dati
I dati salvati nel formato SAS (*.sas7bdat) sono immediatamente disponibili
nelle librerie. Invece i dati in altro formato devono essere importati e convertiti
in .sas7bdat.
22
Cambiare la
libreria
Il nome delle
variabili SAS è
preso dalla prima
riga del file .txt
Codice per il
delimitatore
“TAB”
23
Eventuali errori o
warning
Riassunto delle
caratteristiche del
data set
I dati di output!
Codice per
l'import di file txt
24
Altri esempi
N.B. Il file che si vuole importare deve essere chiuso prima di lanciare il
processo IMPORT altrimenti si crea un conflitto e il comando non viene
eseguito!
25
Modo 2: procedura guidata di import
Da “FRAMMENTI DI CODICE”, nella raccolta “DATI” possiamo cliccare su
IMPORTA FILE CSV o XLSX. Nel codice prodotto, è sufficiente inserire il
nome del file da importare e la libreria di destinazione:
26
Esportare i dati
I dati salvati nel formato SAS (*.sas7bdat) non sono disponibili al di fuori
dell'ambiente SAS. Possiamo però convertirli in altri formati con l'operazione di
export.
Modo 1: con wizard
Dalla sezione LIBRERIE, cliccare con il tasto destro sul file da esportare.
PROC EXPORT
DATA=LibDo.IMPORT_XLS
OUTFILE="/folders/myfolders/laboratorioSAS/provaExportCode.xls"
DBMS=XLS LABEL REPLACE;
run;
28