Sei sulla pagina 1di 45

1

O que o SAS?
Desenvolvido no incio da dcada de 70 na North Carolina State
University, Raleigh, NC
No incio, o objetivo era analisar estatisticamente experimentos
agrcolas e para uso em investigao cientfica.
o pacote estatstico mais usado no mundo (mais de 55.000
organizaes).
SAS Statistical Analysis System
James Goodnight ( 141 mais rico do mundo: patrimnio de 7,1
bilhes de dlares, em setembro de 2011, segundo a Revista
Fortune).
Mais de 12.000 empregados em 129 pases.
90 das 100 maiores companhias no mundo usam SAS.
Todas as 100 maiores universidades no mundo usam SAS (QS
Top Universities).
2
SAS
3
James Goodnight
Receita do SAS 1976-2011
Aumento de 12,1 % de 2010 para 2011
Liderana do SAS
Em 2010 foram produzidos mais de 1,8 Zetabytes ( cada Zetabytes = 1
trilho de gigabytes) de dados no mundo, segundo a IDC Digital
Universe Study de junho de 2011. O mesmo estudo prev que em 2020
sero produzidos cerca de 35 Zb de dados
Dados meteorolgicos: mais de 20.000 estaes no mundo coletando
dados a cada 15 minutos.
Analtica: cincia da anlise.
Primeira empresa em analtica preditiva e minerao de dados
(Forrester, 2010).
Em 2008 adquiriu a empresa TERAGRAM, especializada em
minerao de texto (clientes: Yahoo!, Banco Mundial, CNN, Forbes,
NY Times, Washington Post, etc.)
Em 2010 adquiriu a empresa Assetlink, lder no gerenciamento
integrado de mercado (marketing).
4
Rede Meteorolgica do INMET
5
Cerca de 350
estaes
meteorolgicas
automticas
coletando dados a
cada 5 minutos
O que analtica?
Em 2007 a Universidade Estadual da Carolina do Norte
fundou o Instituto de Analtica Avanada com o
objetivo de estudar analtica. Analtica compreende
desde a coleta e integrao de dados, mtodos
estatsticos e processos complexos de otimizao e
modelagem para a tomada de decises. o primeiro
mestrado em analtica nos Estados Unidos.
Outra definio: parte da lgica que estuda anlise.
6
O que Analtica sob o ponto de vista
prtico?
Processo de extrao de conhecimento de grandes
bases de dados convencionais ou no.
O objetivo encontrar automaticamente padres,
anomalias e regras, com o propsito de transformar
dados em informaes teis para a tomada de decises
e/ou avaliao de resultados.
7
reas envolvidas
8
Armazm
de dados
Estatstica
Inteligncia
Artificial
Analtica
Inteligncia Artificial
Cincia e engenharia usada para fazer as mquinas
inteligentes, usando programas computacionais.
Ex.: fazer um programa de computador para uma
mquina jogar xadrez.
9
Tarefas realizadas pela
Analtica
Modelagem preditiva (classificao e regresso).
Segmentao (anlise de agrupamento).
Sumarizao (mdia, varincia, coeficiente de
variao).
Visualizao (anlise grfica).
10
rvore de Deciso de Plantio de Espcies
Nativas
11
TEMPO
Nublado Ensolarado
Chuvoso
Umidade
No
Plantar
Muito
Vento
Alta
Normal
Sim No
No
Plantar
Plantar
No
Plantar
Plantar
Exemplos de Aplicao
Bancos: Selecionar clientes para estabelecer limites no
carto de crdito.
Medicina: Pacientes entre 25 e 35 anos, casados,
apresentam maior risco de doenas psico-somticas.
Empresa produtora de cigarro: Definir fornecedores
que devem ser financiados atravs de estudos de
ndices de fidelidade, qualidade do produto, volume
entregue.
Japo: empresa de telefonia perdia 40.000 clientes por
ms. A minerao de dados detectou o problema e
diminuiu para 40.000 clientes por ano.
12
Produtos SAS
Base SAS procedimentos bsicos para o manejo de
dados.
SAS/Stat: anlise estatstica
SAS/Graph: apresentao grfica de qualidade.
SAS/OR : pesquisa operacional
SAS/ETS: econometria e sries temporais.
SAS/IML: linguagem matricial interativa
SAS/AF: para desenvolvimento de menus e interfaces.
SAS/QC: controle de qualidade
13
Documentao
http://www.sas.com
http://support.sas.com/onlinedoc/913/docMainpage.jsp :
manuais da verso 9.13 (em 2010 o SAS lanou a verso
9.2.2 e em 2011 a verso 9.3)
http://support.sas.com/documentation/:
documentao geral do SAS para todas as verses.
14
Estrutura bsica do SAS
3 componentes principais na maioria dos programas:
Comandos DATA
DADOS
Comandos PROC (procedure).
15
Comandos DATA
L os dados de fontes internas ou
externas, manipulam os dados e combinam
com outros dados.
Se presta para preparar os dados para
serem usados por um ou mais procedimentos.
Exemplo:
DATA SOLO;
INPUT LOCAL $ PONTO PROF MO;
C=MO*0.58; /* Transforma matria orgnica em
carbono*/
CO2 = C*44/12; /* Transforma carbono em CO2, gs do
efeito estufa */
DATALINES;
.........
16
Comandos PROC
Realiza as anlises dos dados e produz a listagem na
janela OUTPUT.
Exemplos de Proc:
PROC PRINT
PROC ANOVA
PROC SORT
PROC MEANS
PROC UNIVARIATE
PROC GLM
17
Conceitos e Regras do SAS
O nome SAS deve ter no mximo 32 caracteres, composto de letras,
nmeros e do caractere sublinhado (_)
No deve comear por nmero.
No deve ter espaos em branco.
Cada sentena SAS deve terminar com o ponto e vrgula (;)
Linhas que comeam com * e terminam com o ; so tratadas como
comentrio.
Os comentrios tambm podem ser colocados entre /*e */.
RUN; o comando usado para executar o programa.
18
Comando Globais
Existem algumas opes globais:
Linesize = LS para definir o tamanho da linha
Pagesize = PS para definir o tamanho da pgina
NODATE para impedir o aparecimento da data na
listagem de sada
PAGENO=1 para iniciar a listagem com nmero da
pgina = 1.
Estes comandos so geralmente includos no incio do
programa dentro do comando OPTIONS.
Ex.: OPTIONS PS=54 LS=78 NODATE PAGENO=1;
19
Janelas
3 janelas principais
EDITOR usada para criar, editar e executar um
programa SAS.
LOG relata o progresso do programa SAS, mostra os
erros (vermelho) e os avisos (verde).
OUTPUT mostra a sada de um programa SAS. Pode-se
copiar, salvar ou imprimir a listagem do programa SAS.
20
Principais janelas do SAS
21
Entrada de dados para anlise
3 modos de entrada de dados no SAS:
Ler dados digitados ou colados na janela EDITOR
Importar dados do Excel
Outros procedimentos, como importar arquivos .txt,
Access, etc.
22
Ler dados digitados ou colados no EDITOR
DATA ALUNO;
INPUT NOME $ SEXO $ ALTURA;
DATALINES;
JOO M 1.85
MARIA F 1.65
PEDRO M 1.72
JOANA F 1.71
;
PROC PRINT DATA=ALUNO; RUN;
23
Importar dados do Excel
Usar tutorial do SAS:
O arquivo Excel est em um diretrio no computador
ou em mdia: Ex.: Produtor.xls
Na janela EDITORFile Import Data
24
25
26
27
28
Programa de importao de dados do Excel
29
PROC IMPORT OUT= WORK.a1
DATAFILE= "C:\Arquivos2009\Bioestatistica2009\DADEXC.xls"
DBMS=EXCEL REPLACE;
SHEET="Plan1$";
GETNAMES=YES;
MIXED=NO;
SCANTEXT=YES;
USEDATE=YES;
SCANTIME=YES;
RUN;
PROC PRINT DATA=A1;
RUN;
Sada SAS
A listagem (resultados das anlises) pode ser gravada
em HTML (HyperTextMarkupLanguage); PS
(PostScript); RTF (RichTextFormat pode salvar e
editar no Microsoft WORD) e PDF
(PortableDocumentFormat), entre outros formatos.
Na janela OUTPUT do SAS: o contedo pode ser
copiado e colado, por exemplo no Microsoft WORD,
ou impresso diretamente.
30
Programa SAS para gravar arquivo em PDF
(Adobe Acrobat)
31
PROC IMPORT OUT= WORK.a1
DATAFILE= "C:\Arquivos2009\Bioestatistica2009\DADEXC.xls"
DBMS=EXCEL REPLACE;
SHEET="Plan1$";
GETNAMES=YES;
MIXED=NO;
SCANTEXT=YES;
USEDATE=YES;
SCANTIME=YES;
RUN;
ODS PDF FILE=C:\RESULTADO.PDF;
PROC PRINT DATA=A1;
RUN;
ODS PDF CLOSE;
Alguns comandos SAS
LENGTH
IF... THEN...;
DELETE
AND OR
EQ, NE, GE, LE, GT, LT
32
Programa SAS:
Uso do comando LENGTH
33
OPTIONS PS=54 LS=72 PAGENO=1;
DATA A;
LENGTH LOCAL ESPECIE $12.;
INPUT LOCAL $ ESPECIE $ VOLUME IDADE;
DATALINES;
RCLARO E.GRANDIS 123 5
RCLARO E.SALIGNA 211 8
PIRACICABA P.TAEDA 201 15
PIRACICABA P.ELLIOTTII 98 8
BAUR E.GRANDIS 321 7
LENOIS E.UROPHYLLA 303 7
;;;
PROC PRINT DATA=A;
RUN;
Uso de comando condicional:
IF ... THEN ...;
34
OPTIONS PS=54 LS=72 PAGENO=1;
DATA A;
LENGTH LOCAL ESPECIE $12.;
INPUT LOCAL $ ESPECIE $ VOLUME IDADE;
IF LOCAL =RCLARO THEN DELETE;
DATALINES;
RCLARO E.GRANDIS 123 5
RCLARO E.SALIGNA 211 8
PIRACICABA P.TAEDA 201 15
PIRACICABA P.ELLIOTTII 98 8
BAUR E.GRANDIS 321 7
LENOIS E.UROPHYLLA 303 7
;;;
PROC PRINT DATA=A;
RUN;
Caractere
entre
aspas
Uso de comando condicional:
IF ... THEN ...:
OPTIONS PS=54 LS=72 PAGENO=1;
DATA A;
LENGTH LOCAL ESPECIE $12.;
INPUT LOCAL $ ESPECIE $ VOLUME IDADE;
IF IDADE=7 THEN DELETE;
DATALINES;
RCLARO E.GRANDIS 123 5
RCLARO E.SALIGNA 211 8
PIRACICABA P.TAEDA 201 15
PIRACICABA P.ELLIOTTII 98 8
BAUR E.GRANDIS 321 7
LENOIS E.UROPHYLLA 303 7
;;;
PROC PRINT DATA=A;
RUN;
Nmero sem aspas
35
36
Uso de comando condicional:
AND (E)
OPTIONS PS=54 LS=72 PAGENO=1;
DATA A;
LENGTH LOCAL ESPECIE $12.;
INPUT LOCAL $ ESPECIE $ VOLUME IDADE;
IF IDADE=7 AND LOCAL=BAUR THEN DELETE;
DATALINES;
RCLARO E.GRANDIS 123 5
RCLARO E.SALIGNA 211 8
PIRACICABA P.TAEDA 201 15
PIRACICABA P.ELLIOTTII 98 8
BAUR E.GRANDIS 321 7
LENOIS E.UROPHYLLA 303 7
;;;
PROC PRINT DATA=A;
RUN;
37
Uso de comando condicional:
OR (OU)
OPTIONS PS=54 LS=72 PAGENO=1;
DATA A;
LENGTH LOCAL ESPECIE $12.;
INPUT LOCAL $ ESPECIE $ VOLUME IDADE;
IF LOCAL=LENOIS OR LOCAL=BAUR THEN DELETE;
DATALINES;
RCLARO E.GRANDIS 123 5
RCLARO E.SALIGNA 211 8
PIRACICABA P.TAEDA 201 15
PIRACICABA P.ELLIOTTII 98 8
BAUR E.GRANDIS 321 7
LENOIS E.UROPHYLLA 303 7
;;;
PROC PRINT DATA=A;
RUN;
Comandos de comparao
EQ = IGUAL A
NE = DIFERENTE DE
GE = MAIOR OU IGUAL A
LE = MENOR OU IGUAL A
GT = MAIOR QUE
LT = MENOR QUE
38
Programa SAS:
modificao dos dados.
39
OPTIONS PS=54 PAGENO=1;
DATA SOBREV;
INPUT ESP $ IDADE VIVOS ;
TAXAMORT= ((25-VIVOS)/25)*100;
DATALINES;
A01 0 25
A01 1 25
A01 2 21
A01 3 18
A01 4 11
A01 5 7
A01 6 3
A02 0 25
A02 1 25
A02 2 25
A02 3 14
A02 4 6
A02 5 1
A02 6 0
;;;
PROC PRINT DATA=SOBREV;
RUN;
40
Programa SAS:
EQ (Igual a )
40
OPTIONS PS=54 PAGENO=1;
DATA SOBREV;
INPUT ESP $ IDADE VIVOS ;
TAXAMORT= ((25-VIVOS)/25)*100;
IF TAXAMORT EQ 0 THEN DELETE;
DATALINES;
A01 0 25
A01 1 25
A01 2 21
A01 3 18
A01 4 11
A01 5 7
A01 6 3
A02 0 25
A02 1 25
A02 2 25
A02 3 14
A02 4 6
A02 5 1
A02 6 0
;;;
PROC PRINT DATA=SOBREV;
RUN;
41 41
Programa SAS:
NE (Diferente de)
41
OPTIONS PS=54 PAGENO=1;
DATA SOBREV;
INPUT ESP $ IDADE VIVOS ;
TAXAMORT= ((25-VIVOS)/25)*100;
IF ESP NE A02 THEN DELETE;
DATALINES;
A01 0 25
A01 1 25
A01 2 21
A01 3 18
A01 4 11
A01 5 7
A01 6 3
A02 0 25
A02 1 25
A02 2 25
A02 3 14
A02 4 6
A02 5 1
A02 6 0
;;;
PROC PRINT DATA=SOBREV;
RUN;
42 42
Programa SAS:
GE (Maior ou igual a)
42
OPTIONS PS=54 PAGENO=1;
DATA SOBREV;
INPUT ESP $ IDADE VIVOS ;
TAXAMORT= ((25-VIVOS)/25)*100;
IF IDADE GE 5 ;
DATALINES;
A01 0 25
A01 1 25
A01 2 21
A01 3 18
A01 4 11
A01 5 7
A01 6 3
A02 0 25
A02 1 25
A02 2 25
A02 3 14
A02 4 6
A02 5 1
A02 6 0
;;;
PROC PRINT DATA=SOBREV;
RUN;
43 43 43
Programa SAS:
LE (Menor ou igual a)
43
OPTIONS PS=54 PAGENO=1;
DATA SOBREV;
INPUT ESP $ IDADE VIVOS ;
TAXAMORT= ((25-VIVOS)/25)*100;
IF IDADE LE 2 THEN VIVOS=25 ;
DATALINES;
A01 0 25
A01 1 25
A01 2 21
A01 3 18
A01 4 11
A01 5 7
A01 6 3
A02 0 25
A02 1 25
A02 2 25
A02 3 14
A02 4 6
A02 5 1
A02 6 0
;;;
PROC PRINT DATA=SOBREV;
RUN;
Exerccio
A) Fazer um programa SAS para selecionar apenas as
idades maiores que 4 (Use o comando GT).
B) Fazer um programa SAS para selecionar apenas as
idades cujos nmeros de sobreviventes sejam menores
que 15 (Use o comando LT).
44
45

Potrebbero piacerti anche