Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
STATA
Silvia Sartorelli
Indice
1 Struttura e sintassi 3
1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Indicazioni tipografiche . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Alcuni elementi fondamentali . . . . . . . . . . . . . . . . . . . . 3
1.4 Il linguaggio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5 File di do e di log . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4 I grafici 18
4.1 Esportazione dei grafici . . . . . . . . . . . . . . . . . . . . . . . . 19
6 L’interfaccia grafica 24
Prefazione
Lo scopo di questo quaderno è quello di avviare studenti e tesisti all’uso del
pacchetto statistico STATA.
Si tratta di un testo introduttivo che non pretende di sostituire manuali o altri
testi più articolati, ma nasce con lo scopo di mettere l’utente in grado di cogliere
le caratteristiche fondamentali del programma per proseguire autonomamente
l’approfondimento delle procedure che gli saranno necessarie per lo svolgimento
del proprio lavoro.
Spunto ed aiuto per il presente lavoro è stata l’analoga Introduction to Stata
di Jeroen Weesie dell’Università di Utrecht.
Ringrazio tutti quelli che mi hanno già aiutato e quelli che lo faranno in futuro
con utili suggerimenti.
Silvia Sartorelli
Questa opera viene rilasciata sotto la licenza Creative Commons: Attribuzione - Non commerciale - Con-
dividi allo stesso modo 2.5 Italia. Il fruitore è libero di riprodurre, distribuire, comunicare al pubblico, esporre
in pubblico, rappresentare, eseguire e recitare quest’opera e di modificare quest’opera. Alle seguenti condizioni:
deve attribuire la paternità dell’opera nei modi indicati dall’autore o da chi ha dato l’opera in licenza; non
si può usare quest’opera per fini commerciali; se si altera o trasforma quest’opera, o se la si usa per crearne
un’altra, si può distribuire l’opera risultante solo con una licenza identica a questa.
Ogni volta che si usa o si distribuisce quest’opera, si deve farlo secondo i termini di questa licenza, che va
comunicata con chiarezza. In ogni caso, si può concordare col titolare dei diritti d’autore utilizzi di quest’opera
non consentiti da questa licenza.
Nothing in this license impairs or restricts the author’s moral rights.
2
1 Struttura e sintassi
1.1 Introduzione
STATA è un moderno e ricco programma per un amplissimo panorama di analisi
statistiche, la creazione di grafici e la manipolazione di dati. Nasce per l’utilizzo a
linea comando ma le ultime versioni offrono anche la possibilità di eseguire un’a-
nalisi completa, dall’acquisizione dei dati all’esportazione dei risultati, attraverso
menù e finestre di dialogo.
In questa dispensa si descriveranno brevemente le principali funzioni via linea
comando, quindi si presenteranno anche le caratteristiche dell’interfaccia grafica.
La versione di riferimento è STATA/SE 9.2.
3
Figura 1: Interfaccia di STATA all’avvio
. exit, clear
4
Do-files È possibile predisporre dei file che contengono una sequenza di co-
mandi e mandarli in esecuzione in modo da risparmiarsene la digitazione. Questo
è utile quando è necessario usare ripetutamente la stessa sequenza di comandi.
Dataset attivo In STATA si lavora con un dataset alla volta; quello attivo è
quello che viene esplicitamente caricato o acquisito e le cui variabili compaiono
nella finestra “Variables”. Se si deve lavorare con altri file è necessario prima
ripulire la memoria con il comando clear (eventualmente dopo aver salvato).
1.4 Il linguaggio
Con poche eccezioni, la sintassi base del linguaggio di STATA è:
varlist : la maggior parte dei comandi che accettano una lista di variabili non
necessitano che questa sia esplicitmante indicata. Se non appare alcuna
lista, tali comandi assumono che la lista sia all, che è un’abbreviazione per
indicare tutte le variabili del dataset caricato. Per i comandi che alterano o
distruggono dati, STATA richiede che la lista di variabili sia esplicitamente
indicata
5
=exp : specifica il valore che deve venir assegnato ad una variabile ed è usata
principalmente con i comandi generate e replace
weight : indica il peso da assegnare a ciascuna osservazione. La sintassi è:
[weightword=exp], dove le parentesi quadre vanno scritte e con weightword
si intende uno dei possibili tipi di peso specificabili
options : molti comandi prevedono delle proprie specifiche opzioni, queste si
indicano di seguito ad una virgola alla fine del comando
dove con nomedelfiledilog si indica il nome che si è scelto per il file di log. È
utile scegliere nomi che rievochino il contenuto della sessione di lavoro memo-
rizzata; STATA vi associerà automaticamente l’estensione .smcl. Se si indica un
nome semplice questo verrà memorizzato nella working directory, se si desidera
salvarlo altrove, bisognerà indicare un nome completo di percorso, racchiuso tra
virgolette.
Di default verrà memorizzato in tale file tutto ciò che compare nella fi-
nestra dei risultati; se si desidera quindi ricordare solo alcune cose possiamo
interrompere e far riprendere la memorizzazione più tardi:
. log close
6
il tasto di Invio per STATA ha il significato di mandare in esecuzione il comando
in oggetto. Se i comandi sono troppo lunghi e devono stare su più righe si può
momentaneamente sostituire il delimitatore tra i comandi con un carattere a
nostra scelta che va dichiarato prima di essere utilizzato; nel seguente esempio si
immagina di sostituire l’ Invio con il punto e virgola:
. #delimit ;
. use ‘‘filedidati’’;
. gen newvar;
. save ‘‘filedidatimodificati’’;
. #delimit cr
. clear
Si noti che il comando #delimit è valido solo nei do-file e che i punti non
fanno parte della sintassi.
7
2 Acquisizione dei dati
Ci sono tre comandi fondamentali per l’acquisizione di dati in STATA.
2.1 use
Il comando use legge dati già memorizzati in formato STATA e quindi con esten-
sione .dta. La sintassi è:
. use ‘‘nomecompletodelfile.dta”
2.2 insheet
Il comando insheet è molto utile per leggere dati salvati come .csv o tab-
delimited da un foglio elettronico, ossia quando il delimitatore tra i campi è una
virgola o una tabulazione. È necessario, però, rispettare alcuni accorgimenti:
• la prima riga del file deve essere costituita dai nomi delle variabili, che
devono essere al massimo di 32 caratteri e non iniziare per numero o un
carattere speciale; sulla seconda riga deve esserci la prima osservazione
• nel foglio elettronico i dati mancanti devono essere memorizzati come cella
vuota, non sostituiti da spazi, punti o altri caratteri non numerici; 9 o 99
possono andare bene, a meno che non si confondano con possibili valori
validi della variabile
• virgole nei numeri o nelle stringhe possono creare problemi perché STATA li
confonde con delimitatori dei valori, oppure variabili numeriche possono
essere considerate di tipo carattere; bisogna risolvere questo problema nel
foglio elettronico, prima di procedere al salvataggio
• il file originale deve essere esplicitamente salvato (da excel, p.e.) come
Tab-delimited o Comma separated values
8
• il delimitatore tra i campi deve essere una virgola o una tabulazione e non
lo spazio; da excel è possibile salvare i file con estensione .csv e scegliere
un delimitatore diverso (p.e. il punto e virgola), in questi casi insheet
non funzionerà correttamente a meno di non usare l’opzione delimiter e
indicare il carattere che effettivamente separa i campi
• non devono esserci celle vuote alla fine delle righe perché potrebbe essere
memorizzato un numero sbagliato di valori
2.3 infile
Con questo comando si acquisiscono dati memorizzati in file ASCII che soddisfano
le seguenti caratteristiche:
• il file non deve avere i nomi delle variabili sulla prima riga
• i valori delle variabili di tipo carattere che contengono spazi al loro interno
devono essere racchiusi tra virgolette
• il comando suppone che i campi siano separati da spazi e che i dati mancanti
siano sostituiti da qualche carattere (p.e. un punto)
La sintassi è:
dove con varlist si intende l’elenco delle variabili con i nomi che saranno utilizzati
all’interno di STATA. Se una variabile è di tipo carattere bisogna far precedere il
nome della variabile con str#, dove # è un numero che indica la dimensione della
variabile carattere.
Si utilizza infile anche quando le osservazioni sono memorizzate su più
righe o, in via più generale, quando abbiamo bisogno di acquisire dati che sono
9
stati memorizzati in formati particolari ma allora è più facile, se non addirittura
necessario, usare un dictionary file.
Sostanzialmente un dictionary file è un file di testo con estensione .dct che
contiene tutte le informazioni necessarie e le precise specificazioni su quale sia
il file da acquisire, come sono collocate le variabili (tracciato record) e come
andranno chiamate. La sintassi è3 :
2.4 infix
Con questo comando si acquisiscono dati che sono stati memorizzati in file ASCII
in formato fisso. Oltre al nome del file è necessario specificarne la struttura, ossia
scegliere i nomi delle variabili e indicarne la posizione sulla riga. La sintassi è:
2.5 save
Una volta acquisiti ed eventualmente modificati i dati è probabile che si desideri
salvarli e nel formato di STATA, in modo da averli prontamente disponibili in
sessioni di lavoro successive. La sintassi per salvare i dati in formato STATA è:
. describe
10
. describe using ‘‘nomecompletodelfile.dta’’
. set memory 12 m
. list varlist
. edit
Con tale comando viene evocata una finestra grafica simile ad un foglio elet-
tronico che conterrà i dati del dataset attivo. Le colonne rappresentano le va-
riabili e le righe le unità statistiche. Ci si può spostare tra le celle utilizzando il
mouse o le frecce. Si possono passare dati da un foglio elettronico all’altro con
le comuni funzionalità di selezione, copia ed incolla. Vi si possono immmettere e
modificare dati. È possibile modificare le caratteristiche delle variabili evocando,
con un doppio clic sulla colonna corrispondente, la finestra di dialogo “Variable
Proprieties”.
L’editor ha sette bottoni:
Preserve per memorizzare i cambiamenti se i dati sono stati modificati
Restore STATA fa automaticamente un backup dei dati nel momento in cui si
avvia l’editor. Questa funzione recupera la copia di backup se si desidera
cancellare le modifiche effettuate
Sort ordina le osservazioni in modo crescente secondo la variabile selezionata
<< sposta la variabile selezionata in prima posizione
>> sposta la variabile selezionata in ultima posizione
Hide nasconde la variabile selezionata
Delete evoca una finestra di dialogo che permette di scegliere se cancellare la
variabile selezionata, l’osservazione selezionata o tutte le osservazioni che
presentano lo stesso valore di quell’osservazione per la variabile selezionata
11
3 Manipolazione dei dati
STATA può memorizzare i dati in formato carattere o numerico e permette di
compiere la maggior parte delle analisi solo sulle variabili numeriche. Può suc-
cedere che acquisendo i dati con insheet o infile una variabile venga letta
come carattere o stringa seppure sia un numero, per esempio se ci sono spazi
o punti dove non dovrebbero essercene. Per utilizzarle nelle analisi è necessario
riconvertirle in numeriche.
In generale, comunque, è frequente che le variabili non siano già nel forma-
to più utile all’analisi e che quindi si renda necessario qualche manipolazione,
aggiustamento o ricodifica. Per avere uno schema sintetico della natura e della
distribuzione di una variabile, è utile il comando:
. codebook listavariabili
3.2 generate
Il comando generate permette di creare una nuova variabile che sia il risultato
di una funzione e/o una trasformazione algebrica di altre variabili; la sintassi è:
. generate nuovavar=exp
dove con exp si intende un’espressione algebrica che può essere combinazione di
variabili esistenti, operatori e funzioni. Se si vuole sostituire completamente una
variabile esistente il comando è:
12
. replace vecchiavar=exp
Si noti che:
• il nome scelto per la nuova variabile non deve essere il nome di una variabile
già esistente (a meno che non si stia usando replace)
• generate può essere abbreviato ma non replace, questo perché STATA cer-
ca di evitare che i dati esistenti vengano alterati accidentalmente
Spesso i nuovi valori che una variabile assume dipendono dai valori di altre
variabili; per condizionare l’assegnazione dei nuovi valori a quelli delle variabili
esistenti si usa il comando if; la sintassi sarà la seguente:
con questa sintassi verranno create tante variabili dummy quanti sono i livelli
della variabile1 e i nomi saranno vardummy1, vardummy2, etc.
Se si è interessati a creare un’unica dummy che assuma valore 1 per un
determinato livello e 0 per tutti gli altri allora la sintassi è diversa:
13
3.3 recode
Quando si ha necessità di ricodificare una variabile il comando è recode; la
sintassi è:
dove con regola1, etc si intende il criterio di ricodifica dei valori. Ad esempio
si supponga di voler ricodificare una variabile ordinale (varordinale) con 9 classi
(numeri da 1 a 9) in una con sole tre classi (numeri da 1 a 3):
14
. generate nuovadata = date(vecchiadata, ‘‘mdy’’)
un esempio di formato di data è %d, per cui la data 31 agosto 1976, che corri-
sponde al valore in una variabile di tipo data “6087” viene poi visualizzata come
31aug1976. Per tutti gli altri formati possibili si veda il manuale.
Per lavorare con le date STATA propone anche altre utili funzioni; quindi
avendo come argomento una variabile di tipo data:
• day() restituisce il numero del giorno del mese
. keep varlist
. drop varlist
dove con varlist si intende la lista delle variabili da tenere (o eliminare), che può
contenere quanti elementi si desidera; è chiaro che il risultato sarà lo stesso e si
sceglierà un comando o l’altro a seconda della comodità del momento. Si faccia
attenzione, però, perché le variabili eliminate in questo modo non potranno essere
recuperate a meno di ripulire il buffer di lavoro e ricaricare il dataset senza averlo
sovrascritto.
Questi stessi comandi possono essere utilizzati anche per la cancellazione di
osservazioni:
. drop if condizione
15
e analogamente
. keep if condizione
3.6 sort
Alcune procedure richiedono che le osservazioni siano in un determinato ordine
prima di procedere. Il comando sort pone le osservazioni del dataset attivo in
ordine crescente, secondo la variabile specificata.
. sort variabile
. gen identificatore= n
Si sta parlando comunque di dati che sono già stati precedentemente acquisiti in
STATA e salvati in formato .dta.
Nel primo caso si usa il comando append. Si supponga di avere caricato un
file di dati e di voler aggiungere delle nuove osservazioni:
16
le informazioni contenute nel nuovo dataset saranno memorizzate alla fine del
dataset già caricato. Qualsiasi variabile con nome differente nei due dataset
presenterà dei dati mancanti per le osservazioni provenienti dall’altro dataset.
Nel secondo caso, invece, in cui abbiamo le stesse osservazioni ma nuove varia-
bili, il comando è merge. Se non utilizziamo alcuna chiave per far corrispondere
le osservazioni del primo (quello caricato in memoria, detto “master dataset”)
con quelle del secondo (detto “using dataset”), merge compirà un semplice ac-
coppiamento riga per riga ma questo non ci garantisce che le informazioni di un
dataset si riferiscano esattamente alla stessa osservazione dell’altro. Per poter
utilizzare una chiave è necessario che questa esista o si possa creare sulla base
delle informazioni esistenti e che sia presente e dello stesso formato in entrambi
i dataset. Prima di procedere, inoltre, è necessario controllare che magari non
siano stati utilizzati gli stessi nomi di variabili per informazioni che invece sono
addizionali, in tal caso, infatti, STATA preseverà quelle del dataset caricato e non
aggiungerà quelle del nuovo; bisognerà quindi rinominare le variabili prima di
compiere l’unione.
In generale la sintassi per compiere l’unione di due dataset è:
. use primofile
. sort variabilechiave
. merge variabilechiave using secondofile
dove il secondo file deve essere già memorizzato e ordinato secondo la stessa
chiave.
STATA creerà automaticamente una variabile chiamata merge che indicherà
il risultato dell’unione osservazione per osservazione; di seguito il significato dei
valori assumibili da merge:
1 indica le osservazioni del primo dataset che non hanno trovato la corrispet-
tiva nel secondo
2 indica le osservazioni del secondo dataset che non hanno trovato la corri-
spettiva nel primo
5 indica le osservazioni che risultano appaiate e per le quali valori del primo
dataset sono in contraddizione con valori del secondo
17
4 I grafici
STATA consente di creare numerosi tipi di grafici; offre una grande flessibilità non
solo per l’impaginazione dei grafici ma soprattutto per il loro contenuto. Integra
nei grafici le curve di aggiustamento e di lissage, gli intervalli di confidenza e tutti
gli altri elementi grafici associati ai dati. Si possono modificare i titoli, i colori
o i simboli in tutta semplicità grazie alle finestre di dialogo. Infine, è possibile
esportare i risultati in formati diversi compresi PostScript e PNG.
Di seguito si cercherà di focalizzare l’attenzione su alcuni aspetti fonda-
mentali mentre si lascia all’utente l’esplorazione nella vasta scelta di opzioni
e caratterizzazioni.
I grafici sono memorizzati nella memoria centrale o sul disco fisso. Quando
si disegna un grafico questo verrà conservato in memoria centrale con il nome
Graph e verrà sostituito dal comando graph successivo.
STATA permette però di avere più finestre grafiche contemporaneamente; l’op-
zione name() crea un grafico dotato di un proprio nome e presentato in una
propria finestra.
Qualsiasi grafico salvato può essere aperto all’interno di STATA con il coman-
do:
ma si noti che senza l’opzione name verrebbe aperto in Graph e quindi soggetto
a successive sovrascrizioni.
STATA offre comandi per gestire i grafici, sia quelli in memoria centrale che
memorizzati su disco:
graph dir fornisce l’elenco dei grafici conservati sia in memoria che su disco
(nella working directory)
18
graph describe fornisce dettagli riguardanti un grafico specificato, senza spe-
cificazione viene descritto l’ultimo creato
che crea un grafico di dispersione tra due variabili, può essere ottenuto omet-
tendo graph ed addirittura omettendo twoway.
Ci sono diversi tipi (“famiglie”) di grafici, ciascuno dei quali prevede poi
ulteriori caratterizzazioni con propri comandi specifici:
twoway per la rappresentazione di coppie di variabili quantitative
19
STATA può salvare un grafico anche come Encapsulated PostScript (EPS).
Per salvarlo come tale occorre selezionare la voce File >> Save Graph... e
scegliere il formato .eps dalla lista proposta.
20
5 Alcuni comandi di base
Supponiamo che finalmente si siano acquisiti correttamente i dati e che questi
siano nella forma a noi più utile e quindi si possa iniziare con le analisi vere e
proprie.
5.2 Tabelle
Il comando tabulate produce tabelle di frequenze semplici. Per ciascuna moda-
lità della variabile indicata, STATA presenterà nella finestra di output la frequenza
assoluta e le percentuali semplici e cumulate. Specificando due variabili si otterrà
una tabella di contingenza a doppia entrata. Sono utilizzabili inoltre numerose
opzioni per ottenere, ad es. percentuali di riga e colonna, il calcolo dell’indicatore
χ2 e di altre statistiche;
. tab2 varlist
Infine può succedere che si desideri uno schema sintetico di indicatori uni-
variati relativi ad una o più variabili di classificazione; il comando è table con
l’opzione contents in cui si elencano gli indicatori desiderati e la/le variabile/i
su cui si vogliono calcolare:
21
5.3 Matrici di correlazione
Il comando correlate produce la matrice di correlazione o la matrice di varianze
e covarianze per la lista di variabili specificate oppure per i coefficienti risultati
dalla più recente procedura di stima. Se non si specifica l’argomento allora
STATA utilizzerà tutte le variabili numeriche del dataset.
. correlate varlist
22
Per verificare la forma della relazione tra le variabili coinvolte si può usare il
comando scatter che crea grafici di dispersione tra le variabili indicate:
Nel caso si giudichi utile inserire nel modello la trasformata di una variabile, con
il comando ladder si ottiene uno schema con le trasformate più comuni (cubo,
quadrato, logaritmo naturale, radice quadrata e le rispettive funzioni recipro-
che) e il risultato di un test di normalità. Con gladder e qladder si possono
visualizzare i relativi istogrammi e diagrammi quantile-normale.
Una volta perfezionata l’analisi con il comando predict si possono salvare i
valori predetti, i residui, le statistiche di influenza. Le opzioni di predict dipen-
dono in parte dagli strumenti di stima che sono stati precedentmente utilizzati e
quindi vanno verificati volta per volta. La sintassi è:
Il comando crea una variabile alla volta. Se non si specifica nulla creerà una
variabile che contiene i valori predetti sulla base dell’ultimo modello stimato
altrimenti salverà quello che viene specificato, come, ad esempio, i residui:
23
6 L’interfaccia grafica
STATA nasce come applicativo a linea-comando ma attualmente offre la possi-
bilità di svolgere un’analisi completa, dall’acquisizione dei dati all’esportazio-
ne dei risultati, tramite un’“amichevole”6 interfaccia grafica. Chi ha dime-
stichezza con i più noti programmi Windows non avrà difficoltà ad orientar-
si tra i menù e le finestre di dialogo. In particolare le voci del menù Data,
Graphics e Statistics permettono di accedere a quasi qualsiasi comando di
STATA semplicemente cliccando le voci di interesse.
La barra dei menù propone le seguenti voci:
6
Traduzione di user friendly: di facile utilizzo anche per l’utente meno esperto
24
1 Open apre un dataset in formato STATA (.dta); cliccando sul-
la freccetta propone un elenco di dataset recentemente
usati
2 Save salva il dataset correntemente in memoria
3 Print stampa il contenuto delle finestre “Results”, “Viewer”
o “Graph”. Cliccando sull’icona viene scelto “Results”
mentre cliccando sulla freccetta viene proposto l’elenco
delle finestre tra cui scegliere
4 Log Begin inizia un nuovo file di log, aggiunge ad un file di log
esistente o chiude o sospende il log corrente7
5 Viewer apre il Viewer oppure porta il Viewer davanti alle fine-
stre. Il Viewer è una finestra in cui si possono vede-
re informazioni d’aiuto, visualizzare e stampare file di
log della corrente sessione o di sessioni di lavoro passa-
te, visualizzare o stampare qualsiasi file di STATA oppu-
re file ASCII, aggiungere nuovi comandi da internet ed
installare gli aggiornamenti ufficiali di STATA
6 Results porta la finestra dei risultati davanti alle altre finestre
7 Graph porta la finestra dei grafici davanti alle altre finestre.
Cliccando sulla freccetta si sceglie quale tra le finestre
grafiche
8 Do-file editor apre un file di do oppure porta l’editor di do-file
davanti alle altre finestre
9 Data Editor apre l’editor dei dati opppure lo porta davanti alle altre
finestre
10 Data Browser apre il visualizzatore dei dati o lo porta davanti alle altre
finestre
11 Clear comanda a STATA di continuare quando si è mo-
mentaneamente fermato nel mezzo di un lungo
output
12 Break interrompe il processo corrente
La maggior parte delle finestre di dialogo propone gli stessi cinque tasti
presenti in fondo: OK, Cancel, Submit, ? e R.
25
Il comando scelto nella finestra di dialogo è mandato in esecuzione esatta-
mente come se fosse stato digitato in “Command”, comparirà nella finestra di
“Review” e sarà da qui accessibile per usi futuri.
Il bottone nell’angolo in basso a sinistra con il punto di domanda permette
di accedere al sistema di “help” di STATA. Scegliendolo evocherà il file di “help”
del comando associato alla finestra di dialogo in questione.
Il bottone con la lettera R è il bottone di “reset”. Ogni volta che si apre una
finestra di dialogo questa riporterà gli ultimi parametri che sono stati inseriti
quindi R si userà quando si desidera ripulire i campi dai valori memorizzati in
precedenza.
I comandi di STATA sono evocati non solo dai menù ma anche attraverso altri
due metodi. Se si ricorda il nome del comando di cui si vuole la finestra di dialogo
si può usare il seguente comando:
. db nomedelcomando
26
7 Breve sommario di comandi
In questo capitolo si darà una breve spiegazione dei più importanti ed usuali
comandi STATA.
27
sqrt() la radice quadrata
sum() la somma di tutti i valori nell’espressione tra parentesi per tutte le prece-
denti osservazioni e la corrente
28
7.2.2 manipolazione dei dati
29
sort mette le osservazioni in ordine crescente secondo una o
più variabili; i dati mancanti vengono collocati in fondo
Data >> Sort >> Ascending sort
rename nomeold nomenew cambia il nome di una variabile
Data >> Variable utilities >> Rename variable
drop varlist elimina le variabili specificate nella lista
Data >> Variable utilities >> Keep or drop
variables
drop if condizione elimina le osservazioni per le quali la condizione
specificata è vera
Data >> Variable utilities >> Keep or drop
observations
keep varlist mantiene solo le variabili specificate nella lista
Data >> Variable utilities >> Keep or drop
variables
keep if condizione mantiene solo le osservazioni per le quali la condizione
specificata è vera
Data >> Variable utilities >> Keep or drop
observations
sample # estrae un campione casuale dal dataset della dimensione
percentuale specificata dal numero indicato
Statistics >> Resampling >>Draw random sample
30
Statistics >> Summaries, tables & tests >> Tables
>>... One Way tables oppure ...Two-way tables with
measures of association
table produce tabelle a più entrate di indicatori univariati (con una
migliore formattazione)
Statistics >> Summaries, tables & tests >> Tables
>> Table of summary statistics
collapse aggrega i dati producendo un nuovo dataset con solo gli
indicatori calcolati sulle variabili specificate
Data >> Create or change variables >> Other
variable transformation commands >> Make dataset
of means...
inspect qualche ulteriore indicatore univariato sulla distribuzione
delle variabili
Data >> Describe data >> Inspect variables
correlate produce correlazioni o matrici di varianze e covarianze
Statistics >> Summaries, tables & tests >> Summary
statistics >> Correlations and covariances
pcorr produce correlazioni parziali
Statistics >> Summaries, tables & tests >> Summary
statistics >> Partial correlations
spearman/ ktau correlazione dei ranghi di Spearman, il tau-b di Kendall
Statistics >> Summaries, tables & tests >>
Nonparamteric tests of hypothesis >> ... Spearman’s
rank correlation / ... Kendall’s rank correlation
count if exp calcola quante osservazioni soddisfano la condizione espressa
da exp
Data >> Variable utilities >> Count observations
satisfying condition
7.2.4 help
31
Riferimenti Bibliografici
• Jeroen Weesie, (2000) Introduction to Stata
• STATA Press, (2005) Getting Started with STATA for Windows, Release 9,
StataCorp, College Station, Texas, USA.
32