Sei sulla pagina 1di 28

A.A.

2016 / 2017

Laboratorio
del corso di
STATISTICA
Donata Bonino

Corso di Laurea in Pianificazione Territoriale, Urbanistica e


Paesaggistico-Ambientale
Introduzione al SAS

Parte I:
capire la filosofia del SAS; primi passi con i dati

➢ Il software SAS: introduzione e logica


➢ Regole di base del linguaggio SAS
➢ Esempio: visualizzare sullo schermo / salvare
➢ Importare ed esportare i dati

2
Il software SAS
Il SAS mette a disposizione un ambiente che consente input, manipolazioni,
analisi, report, memorizzazione dei risultati e creazione di file SAS,
compatibilmente con standard internazionali, quali ISO o IEEE.
Il SAS Institute e’ stato fondato nel 1976 a Raleigh, N.C.
SAS e’ un acronimo di “Statistical Analysis System”
Questo software è nato come un semplice linguaggio statistico ma si è evoluto
negli anni e ora offre soluzioni per:
• analisi statistiche classiche,
• data warehousing: ambiente con strutture dati finalizzate al supporto delle
decisioni,
• data mining: l'estrazione di informazione utile, eseguita in modo automatico o
semiautomatico, da grandi quantità di dati,
• visualizzazione di dati,
• sviluppo di applicazioni personalizzate. http://www.sas.com/

Ecco come si definiscono:


“SAS is the world's leader in business analytics software, delivering the
breakthrough technology you need to transform the way you do business.”
3
Strumenti applicativi
Esistono diverse interfacce grafiche, dalla generica Base ad altre, come
Enterprise Guide e Enterprise Miner, che sono invece dedicate a particolari tipi
di analisi statistica. Tutte fanno riferimento al core, ovvero alle librerie base.

Enterprise Guide: possiamo accedere all'area di programmazione dalla


finestra iniziale, selezionando Nuovo programma SAS:

… oppure dalla barra dei comandi (Programma/Nuovo programma)


4
Strumenti applicativi
Con l'interfaccia Base, invece, ci troviamo in questo ambiente di
programmazione:

5
Strumenti applicativi
Noi utilizzeremo SAS Studio, di cui esiste una versione online ed una installata
in locale. In entrambi i casi l'ambiente di lavoro si presenta così:

Risultati finestra dove vengono riportati


i risultati delle analisi richieste, se il
comando è andato a buon fine

Log: finestra dove vengono riportate tutte le note


relative al programma sottoposto e in cui si
verifica la coerenza tra le richieste, la sintassi
nonché i messaggi di errore e attenzione e
alcuni risultati

6
Strumenti applicativi

File e cartelle del server finestra dove


gestire il caricamento dei file da PC a
ambiente SAS
Processi e frammenti di codice: finestre da cui
accedere a funzioni statistiche/grafiche/gestione
dei dati predefinite

Librerie: finestra da cui gestire le librerie SAS

Collegamenti di file: shortcut per la gestione dei file

7
La logica del SAS

Un programma SAS è una sequenza di istruzioni di cui l'utente


richiede l'esecuzione al software.

I passi fondamentali sono:

• DATA STEP:
procedura di inserimento e manipolazione dati che porta alla
creazione di un Data Set SAS;

• PROC STEP:
procedura per elaborare il Data Set SAS (ad esempio per
effettuare analisi statistiche)

8
Regole di base del linguaggio di
programmazione SAS
I comandi SAS:

- finiscono tutti con il simbolo ;


- non sono case-sensitive: si possono scrivere indifferentemente in
maiuscolo o minuscolo
- possono continuare su due o più linee
- possono stare sulla stessa linea con altri comandi, purchè separati
da ;
- possono partire in qualsiasi colonna

I commenti in SAS si possono inserire in due modi:

*commento;
(cioè * all’inizio e ; alla fine del commento)
/*commento/
(cioè /* all’inizio e / alla fine del commento)

9
Creare ed eseguire un programma
SAS
I passi essenziali per sottomettere un programma SAS sono:

1. si scrive nella finestra EDITOR

2. si sottomette con il comando Submit (con il tasto F8 oppure cliccando


sull’icona presente sulla toolbar )

3. si leggono i risultati nella finestra RISULTATI (o nella finestra LOG)

4. se i risultati non appaiono o non sono conformi alle aspettative, va


controllata la finestra di LOG per controllare gli eventuali errori

Con l'Enterprise Guide, una volta eseguito il comando si aprono le finestre


necessarie (log, output).
10
Visualizzazione nella finestra di Log
Esempio: eseguire una somma!

Procedura: Scrivo le seguenti istruzioni nell’Editor

Non mi interessa salvare il risultato


data _null_;
Chiamo il risultato: Risposta Risposta = 1 + 1;
put Risposta;
run;
Scrivo il risultato nel foglio: Log

Ho concluso la procedura

Faccio eseguire con , e ottengo:

11
Ottengo, nella finestra di LOG:

Conteggio delle istruzioni


sottoposte. Può essere
utile quando ci sono degli
errori per capirne la
posizione

Il risultato viene scritto


dopo le istruzioni
sottoposte

Tempo di calcolo:
l'istruzione si è conclusa

12
Per aumentare la leggibilità, possiamo aggiungere un = dopo il nome della
variabile, che verrà visualizzato:

data _null_;
Risposta = 1 + 1;
put Risposta=;
run;

13
Salvare su file
Se si vuole salvare il risultato della priocedure in una tabella (spreadsheet),
basta inserirne il nome nella prima istruzione.

data NomeFile;
Risposta = 1 + 1;
put Risposta;
run;

I nomi utilizzati per le tabelle possono iniziare con una lettera o con un
underscore e possono contenere lettere, numeri e underscores.
Il SAS non è case-sensitive ma l’utilizzo di lettere maiuscole è utile per
rendere i nomi più leggibili.

NB: I comandi possono essere scritti in sequenza nella finestra di Editor,


salvati in un programma *.sas, successivamente richiamati e nuovamente
eseguiti.
Può essere eseguita anche solo una parte di codice, selezionandola con il
mouse prima di lanciare l'esecuzione. Altrimenti, tutto il codice nell'editor
viene eseguito ogni volta che si clicca .
14
ll dataset ha:
1 osservazione (1 riga)
1 variabile (1 colonna)

SAS ha creato il nuovo dataset: work.NomeFile.


work è una libreria e si riferisce a una cartella temporanea che si trova sul server e che
viene svuotata tutte le volte che si termina la sessione SAS.
Il dataset NomeFile viene salvato nella cartella work e verrà cancellato al termine della
15
sessione SAS.
Un altro esempio…
data _null_;
x = 2;
y = 3;
potenza = x ** 2;
polinomio = (x**3/3)-(y**2/2)-6*x;
put potenza= polinomio= x y;
run;
Si possono inserire anche le funzioni predefinite:
data _null_;
x = 1;
funzSin = sin(x);
put funzSin;
run;

Le funzioni in SAS si trovano nella seguente documentazione online:


http://support.sas.com/documentation/cdl_main/index.html
Se clicchiamo su “SAS Procedures by Name and Product” troviamo
l’elenco di tutte le funzioni presenti in SAS con la relativa descrizione.
16
Importare i dati
I nostri programmi prevederanno una serie di passi…

1. Inserire i dati nel sistema e renderli leggibili dal sistema, creandoli o


importandoli

2. Identificare il sottoinsieme di dati di interesse

3. Eseguire l’analisi

4. Visualizzare i risultati

5. Esportare i risultati ottenuti

Come primo passo, dobbiamo decidere dove importare i


dati, creare le librerie necessarie e poi importare i dati!

17
Librerie
Il SAS salva i dati in una cartella che viene chiamata “LIBRERIA”, e che è
un alias di riferimento a una o più cartelle dell’hard disk.
In automatico, all’avvio, il SAS genera una libreria temporanea che si
chiama “Work”, e che viene utilizzata in mancanza di ulteriori indicazioni.
Questa libreria è temporanea e pertanto viene svuotata e cancellata
ogni volta che si termina la sessione di SAS.

SAS University Edition può collegarsi all'hard disk tramite le cartelle


condivise della macchina virtuale (VM). Il percorso di default è
Cartella_di_installazione\SASUniversityEdition\myfolders
Oppure, dalle
impostazioni della
VM:

18
Librerie
Per creare una nuova libreria (1° modo):
Creiamo una nuova cartella, per esempio laboratorioSAS, in una cartella locale
(nota: in laboratorio, non su Y: non abbiamo permesso di scrittura!)

1) Sintassi da inserire nella finestra Codice:


libname nome “percorso”;

Esempio:
libname LibDo "/folders/myfolders/laboratorioSAS";

N.B. Non creo nuove cartelle sull’hard disk, ma solo la libreria SAS!
Inoltre, se ci sono già file SAS nella cartella, questi saranno disponibili
nella libreria (senza bisogno di importarli)

19
2) Cliccare sull’icona “cartelle sovrapposte” nella sezione Librerie
nome di
riferimento per
la libreria (Max
8 caratteri)

percorso per
la cartella cui
si riferisce la
libreria

N.B. Dato che le librerie sono riferimenti temporanei a cartelle sull’hard


disk, quando si riavvia SAS bisogna rifare tutta la procedura 1) o 2).

Per riavviare automaticamente una libreria all’avvio del SAS basta includere il
comando libname all’inizio del programma che utilizza i dati contenuti nella
libreria, oppure cliccare su “Ricrea all'avvio”.
20
Opzioni della proc libname
Possiamo specificare varie opzioni per le librerie:
libname LibDo v9 “/folders/myfolders/laboratorioSAS” access=readonly;

specifica la versione SAS


per la creazione (nel nostro Se voglio essere sicuro di non
caso, la Versione 9 ) modificare i files della libreria,
seleziono l’accesso in sola lettura

Una libreria può anche fare riferimento a più cartelle distinte sul disco fisso:
libname Libprova v9 ("/folders/myfolders/laboratorioSAS"
"/folders/myfolders/Articoli")
La libreria Libprova contiene ora tutti i file delle due cartelle!

21
Importare i dati
I dati salvati nel formato SAS (*.sas7bdat) sono immediatamente disponibili
nelle librerie. Invece i dati in altro formato devono essere importati e convertiti
in .sas7bdat.

Modo 1: wizard di import

Per caricare un file in una cartella di SAS Studio, cliccare su .


Selezionare con il mouse la cartella su SAS Studio e cliccare su
Nella pagina a destra, selezionare le opzioni.

SAS è in grado di interpretare files nei seguenti formati:


Formato testo delimitati da caratteri speciali: spazi, virgole…
Dbase
Excel
Access
...

22
Cambiare la
libreria

Il nome delle
variabili SAS è
preso dalla prima
riga del file .txt

Codice per il
delimitatore
“TAB”

23
Eventuali errori o
warning

Riassunto delle
caratteristiche del
data set

I dati di output!

Codice per
l'import di file txt

24
Altri esempi

Provare ad importare file Excel di diversi formati:


1. Prova_xls.xls
2. Prova_xlsx.xlsx

Notare nel codice la differenza di delimitatore!

N.B. Il file che si vuole importare deve essere chiuso prima di lanciare il
processo IMPORT altrimenti si crea un conflitto e il comando non viene
eseguito!

25
Modo 2: procedura guidata di import
Da “FRAMMENTI DI CODICE”, nella raccolta “DATI” possiamo cliccare su
IMPORTA FILE CSV o XLSX. Nel codice prodotto, è sufficiente inserire il
nome del file da importare e la libreria di destinazione:

26
Esportare i dati
I dati salvati nel formato SAS (*.sas7bdat) non sono disponibili al di fuori
dell'ambiente SAS. Possiamo però convertirli in altri formati con l'operazione di
export.
Modo 1: con wizard
Dalla sezione LIBRERIE, cliccare con il tasto destro sul file da esportare.

Modo 2: da riga di comando


Se ci serve salvare i dati in un formato di Excel più vecchio?
Da PROCESSI/UTILITA' richiediamo una nuova pagina di codice

PROC EXPORT
DATA=LibDo.IMPORT_XLS
OUTFILE="/folders/myfolders/laboratorioSAS/provaExportCode.xls"
DBMS=XLS LABEL REPLACE;
run;

Sostituisce il file se esistente


Usa nome variabili come etichette
27
Guardare i dati…
Per vedere i dati salvati nei files di SAS si può cliccare direttamente sullo
spreadsheet nella libreria o nella cartella oppure si può usare la procedura
print:
proc print data = LibDo.prova;
var A B C;
run;

Il comando var è opzionale; se non si indica, vengono visualizzate tutte le


variabili del dataset.
Se interessano solo alcune variabili...
var A C;  compaiono solo A e C

28