Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Entendendo o Stata
O Stata possibilita gerenciamento de dados, anlise estatstica e elaborao de grficos. Existem programas para tornar o Stata mais amigvel para aqueles que no gostam de trabalhar com comandos, mas o curso ser baseado no estilo padro de comandos. Principais janelas do Stata: Review, Variables, Results, Command e Do-file Editor. Bancos de dados em Stata possuem extenso ".dta", e programas ( syntax) possuem extenso ".do". O Stata trabalha com os dados copiando-os na memria RAM. Em virtude disso, bancos de dados grandes podem ser de difcil gerenciamento no Stata. Quando um banco aberto, nenhuma mudana realizada at que voc salve o banco. O fato de usar uma cpia dos dados importante porque: Quando se utiliza o comando "use arquivo", os dados so copiados para a memria do computador, e o arquivo original fechado. Voc pode fazer o que quiser com os dados na memria, e a cpia permanente continuar a mesma em seu disco. A nica forma de mudar uma cpia permanente dos dados utilizando o comando "save". Alm disso, se algum erro reportado, nenhuma mudana realizada no banco que se encontra na memria.
Inserindo comentrios
Para inserir comentrios no Stata, simplesmente utilize asterisco (*) antes do texto:
*Isso um tido como um comentrio no Stata
2 2. Atualizando o Stata pela internet 3. Interface de sistema operacional 4. Comeando, salvando e terminando o trabalho 5. Importando dados para o Stata 6. Usando e salvando dados do disco 7. Reportando dados bsicos 8. Manipulao de dados 9. Formatando 10. Convenincia update, net, ado, news pwd, cd, sysdir, mkdir, dir, erase, copy, type clear, set mem, set more, log, notes, exit infix, input, infile, insheet use, save, append, merge, compress describe, codebook, list, browse, edit, count, inspect, summarize, table, tabulate generate, replace, egen, rename, drop, keep, sort, encode, decode, order, by, reshape format, label display
1. Obtendo ajuda
O comando "findit" procura informaes de uma determinada palavra-chave. O "findit" faz uma procura completa, incluindo as procuras de " help" que procura por comando existente no Stata; "search" que procura pela palavra-chave na internet; e " net search" que procura por pacotes para instalao no site www.stata.com.
Utilize o comando "ado" para listar pacotes instalados. Para descrever pacotes instalados, digite:
ado describe
3 pwd cd sysdir mkdir dir erase copy type Mostrar diretrio em que se encontra. Mudar para diretrio indicado. Mostrar diretrio em que o Stata est instalado. Criar diretrio em seu computador. Ver o contedo do diretrio em que se encontra. Apagar arquivo no diretrio especificado. Copiar arquivos para mesmo diretrio ou diretrio diferente. Mostrar contedo de arquivo na tela do Stata.
Stata d preferncia a arquivos nesse diretrio. Diretrio com comandos originais. Armazena tudo oriundo da internet, tambm chamado de STBPLUS. Arquivos pessoais. Comandos so armazenados em sub-pastas com a primeira letra do comando.
Nunca bom utilizar o diretrio em que o Stata est instalado para trabalhar, j que arquivos de programas podem ser apagados, ou arquivos pessoais podem ser removidos em uma atualizao do programa. O recomendado utilizar um diretrio para cada projeto. Voc pode criar diretrios com o comando mkdir no Stata, ou no prprio Windows Explorer. Vamos supor que queremos criar um diretrio para esse curso no drive C:\. Esses so os procedimentos:
cd C:\ mkdir cursodcp cd cursodcp mkdir dados cd dados
A partir de agora, assim que comear o Stata, mude para o diretrio recentemente criado:
cd C:\cursodcp\dados
Se voc criar um diretrio com espao entre as palavras, necessrio utilizar aspas:
cd "C:\curso dcp\dados"
Voc tambm pode ver o contedo de diretrios, apagar arquivos, copiar arquivos, e examinar o contedo de um arquivo. Listar o contedo do diretrio atual:
dir
4 Listar os arquivos que possuem a extenso ".dta" e nomes que comeam com "prog" e possuem mais dois caracteres:
dir prog??.dta
Copiar arquivo no diretrio atual. Isso importante para realizar cpia de segurana, antes de realizar mudanas em um arquivo:
copy meuarquivo.abc meuarquivo.bak
Para que essa quantidade de memria seja permanente toda vez que abrir o Stata:
set mem 100m, perm
Se grandes tabelas ou regresses forem ser geradas pelos seus comandos, bom digitar o comando abaixo para que o programa no paralise a tela:
set more off
Abrindo um arquivo ".log" para salvar o trabalho. O ideal escrever esse comando no comeo do arquivo ".do":
log using "C:\cursodcp\log\aula1.log", text replace
Salvando os comandos e tabelas geradas. O ideal escrever esse comando no final do arquivo ".do":
log close
Para salvar somente os comandos, fazer um arquivo ".do" no "Do-file Editor". Se a janela "Review" tiver sido usada, clique com o boto direito do mouse para copiar o contedo e colar em um arquivo ".do". Colocando avisos no banco de dados:
notes: criar rtulos em portugus para variveis p501-p511
e
notes p201: verificar se varivel foi codificada corretamente
5 Encerrar o Stata:
exit
Se houver um banco de dados aberto no Stata, o ideal digitar o seguinte comando para encerrar o programa sem salvar os dados:
exit, clear
ou
infix v0001 001-005 v0002 006-008 v0003 009-010 using "C:\Censo\1960\rs.txt"
J que os bancos de dados em Stata usam a extenso ".dta", voc pode abrir o banco sem digitar a extenso:
use Argentina51
Se algum outro banco j estiver aberto, preciso utilizar a opo "clear" para limpar a memria do Stata:
use c:\cursodcp\dados\Argentina51.dta, clear
Como vimos, o comando para abrir um banco "use". Se no houver nenhum banco aberto, utiliza-se:
use arquivo.dta
Ou seja, um banco salvo somente com o comando "save", tornando difcil perder os dados originais. Mesmo se o comando "save" no for usado intencionalmente, o Stata recusar gravar o banco por cima do original, se a opo "replace" no for colocada.
e
describe p501-p511
Outra forma de mostrar informaes sobre as variveis do banco, com ilustrao de quantidade de nmeros negativos, positivos e "missings", alm de um pequeno grfico de ramos e folhas (com distribuio da varivel entre os seus valores) com o seguinte comando:
inspect
Para contar quantos legisladores pensam que os riscos para consolidao da democracia so muito altos em decorrncia da crise econmica (p502=4) e da dvida externa (p506=4):
count if p502==4 & p506==4
Para mostrar o banco na tela de resultados do Stata, utilize o comando "list". Para mostrar as variveis que indicam a opinio dos legisladores do partido UCR (partido=2) sobre as possveis vantagens de um regime democrtico (p201 e p202 originrias da pergunta P2 na pgina 1 do questionrio), digite o comando:
list p201 p202 if partido==2
| p201 p202 | |---------------------| | la posib la posib | | la prote la resol | | la prote la posib | | la prote la posib | | la prote el respe | |---------------------| | la prote la resol | | la prote la posib | | la prote el respe | | la prote la mayor | | la prote la posib | |---------------------| | la prote la mayor | | el creci la posib | | la prote la posib | | la prote la posib | | la posib la prote | |---------------------| | la prote la posib | | la mayor el creci | | la resol la mayor | | el respe el creci | | el respe la posib | |---------------------| | la posib la prote | | la posib la resol |
21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 97. 98. 99. 100. 101.
7
102. | la prote la posib | 103. | la prote el respe | +---------------------+
21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 97. 98. 99. 100. 101. 102. 103.
Para mostrar o banco em uma tela separada, utilize o comando "browse". Como no exemplo anterior:
browse p201 p202 if partido==2 browse p201 p202 if partido==2, nolabel
Para editar um banco, utilizasse o comando "edit" da mesma forma que o "list" e "browse". O comando "edit" pode ser acessado com o cone "Data Editor" da barra de ferramentas. Sem a utilizao da opo "nolabel", as variveis que aparecem em preto no possuem rtulos, aquelas que aparecem em azul possuem o rtulo visualizado, e as que apresentam a cor vermelha so variveis nominais (string ou character). possvel obter estatsticas bsicas de variveis com o comando "summarize" que o mesmo que "sum". Podemos analisar as respostas quanto aos temas que podem representar uma ameaa ao risco de consolidao da democracia (p501 a p511):
summarize p501-p511
Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------p501 | 104 1.596154 .6464125 1 4 p502 | 104 3.144231 .8409226 1 4 p503 | 104 2.048077 .9791993 1 4 p504 | 103 3.048544 .8561043 1 4 p505 | 104 2.509615 .9552633 1 4
8
-------------+-------------------------------------------------------p506 | 103 3 .9801961 1 4 p507 | 104 3.086538 .7896242 1 4 p508 | 103 2.203883 .7965517 1 4 p509 | 103 3.38835 .8311699 1 4 p510 | 103 2.84466 .9472073 1 4 -------------+-------------------------------------------------------p511 | 103 2 .8631906 1 4
Note acima que essas variveis variam de 1 (Nada) a 4 (Muito). bom estar ciente que poderia haver casos iguais a 8 (No sabe=NS) e 9 (No respondeu=NC), o que enviesaria a anlise. Uma anlise de percentil poderia ser feita com a opo "detail" que o mesmo que "d":
summarize p501-p511, detail
Variveis nominais so automaticamente retiradas do sumrio pelo Stata. Para ordenar um banco de dados por uma varivel ou conjunto de variveis, utilize a opo "sort":
sort partido
Para realizar uma tabela de uma varivel, utilize o comando "tabulate", que o mesmo que "tab". As opes de "nolabel", "if" e "missing" tambm podem ser utilizadas:
tab p501 if p501!=1, nolabel missing
Para gerar tabelas simples para cada uma das variveis listadas:
tab1 partido p501-p511
Para gerar tabelas com cruzamentos entre duas variveis para todas combinaes possveis:
tab2 partido p501 p502
Para obter a mdia, desvio padro e freqncia da varivel p501 em cada partido:
tab partido, summarize(p501)
8. Manipulao de dados
Transformar varivel numrica em varivel nominal ( string), utilize o comando "decode":
decode partido, generate(nomepart)
O comando "tostring" no exige a criao de uma nova varivel para transformar uma varivel numrica para nominal. Isso s funciona se a varivel no tiver rtulo ( label):
tostring nestu, replace
O comando "destring" pode converter todas variveis nominais para numricas em um nico comando:
destring, replace
Mover uma varivel para uma posio anterior segunda varivel indicada no comando:
move entrev pais
Para excluir uma varivel ou conjunto de variveis do banco, utilize a opo "drop". Foi escolhido o nmero do estudo (nestu), pois ele no varia no banco de dados:
drop nestu
Note que s exclumos a varivel da cpia do banco que est na memria RAM, e no a que est originalmente no disco. Para remover observaes do banco, utilize o comando "drop" com indicao da primeira e ltima observaes a serem retiradas. Por exemplo, vamos remover as observaes de 5 a 10:
drop in 5/10
Essa remoo pode tambm ser feita de outras formas. Por exemplo, vamos remover aqueles que consideram que as relaes entre as foras armadas e o governo (p501=1) no apresentam risco para a consolidao da democracia:
drop if p501==1
ou
drop if p501!=2 & p501!=3 & p501!=4 & p501!=.
ou
drop if p501<2
ou
drop if p501<2 & p501>=1
No Stata, o "missing" o maior nmero (ao contrrio do SAS), por isso o comando "drop if p501<2" no exclui os valores de p501 iguais a "missing". possvel tambm escolher por manter determinadas variveis no banco com o comando "keep":
keep if p501!=1
ou
keep if p501==2 | p501==3 | p501==4 | p501==.
Somente recapitulando: == igual != diferente > maior >= maior/igual < menor <= menor/igual & E | OU