Sei sulla pagina 1di 7

AGRO 6998 Conferencia 1 Introduccin al uso de SAS SAS es el programa estadstico ms usado en todo el mundo.

Existen versiones del mismo para casi todos los sistemas operativos. La versin actual para Windows es la 9. Con este programa se pueden realizar todo tipo de manejo de datos, grficos y anlisis estadsticos. Para correr SAS, seleccione el cono SAS en la pantalla, oprimiendo 2 veces el botn izquierdo del mouse. Aparecern cuatro ventanas: el program editor, el log, el output y el explorer. Para moverse entre ventanas use el men WINDOW de la parte superior. En el editor del programa se escriben el programa y los datos (o se leen de un archivo de texto). Una vez que el programa est escrito, lo procesamos con el comando submit u oprimiendo el cono con el hombrecito corriendo. En la ventana de log aparecer cada parte del programa a medida que corre, junto con notas (en azul), avisos (en amarillo) y errores (en rojo). En la ventana de salida aparecer (si el programa corri correctamente) la salida deseada (en la ventana del explorer se indicarn las partes de cada salida). Para escribir un programa SAS se usa la ventana del editor de programa, que funciona como la mayora de los procesadores de texto (puede seleccionar un trozo, borrarlo, hacer cut and paste, etc.). El programa SAS consta de tres partes o etapas: DATA, los datos y PROC. En la etapa DATA hay diferentes comandos que le indican a SAS cmo leer los datos, realizar clculos, crear nuevas variables, eliminar observaciones, etc. Los datos se pueden incorporar al programa (si no son demasiados lo ms comn es hacerlo as), pueden leerse de un archivo externo (que debe ser un archivo de texto), o importarse desde un archivo Excel. Las etapas PROC realizan los anlisis o grficos solicitados. Dentro de cada DATA o PROC los comandos van separados por ; (esto es muy importante, ya que la mayora de los errores surgen por la falta de ; en el programa). Cada DATA debe ir identificado con un nombre. Luego del comando DATA nombre; debemos colocar un comando INPUT, que indique las variables a ser ledas. Los nombres de las variables se indican en el orden en que se presentan en los datos. Para variables alfanumricas el nombre debe ir seguido de $. Luego del comando INPUT se pueden colocar (opcionalmente) comandos para transformar observaciones, realizar clculos, etc.). El ltimo comando de la etapa DATA es DATALINES; que le indica a SAS que las lneas que siguen son datos (hasta la primera lnea que termine en ;).

Si los datos se leen de un archivo externo, antes del comando INPUT se debe poner el comando INFILE. Por ejemplo, si los datos estn en el archivo misdatos.txt, INFILE e:\ misdatos.txt; En este caso no se usa el comando DATALINES (ya que no hay lneas de datos para leer en el programa). Luego de los datos se colocan los diferentes PROCedures. Por ejemplo, para listar las observaciones contenidas en el DATA nombre, podemos escribir PROC PRINT DATA=nombre; RUN; Una vez que hemos escrito el programa, debemos guardarlo en nuestro disco (para evitar que se nos borre accidentalmente). Para ello usamos el men FILE>SAVE AS, y escogemos un nombre en el disco A. Para correr el programa usamos el comando submit u oprimimos el cono con el hombrecito corriendo. Si el programa corre sin problemas la ventana de salida aparece automticamente con la salida correspondiente. A sta la podemos guardar en un archivo (men FILE>SAVE AS) o imprimir (men FILE>PRINT). Recuerde que deber traer su propio papel para imprimir en las impresoras del Cetro de Cmputos. Si por alguna razn no deseamos esa salida la podemos borrar con el men EDIT>CLEAR ALL. Si el programa no ha corrido correctamente (la ventana de log tiene avisos y/o errores), debemos volver a la ventana del editor del programa y realizar las correcciones necesarias. Recuerde que deber volver a guardar el programa una vez corregido (men FILE>SAVE). Para leer un programa (o datos) desde un diskette debe usar el men FILE>OPEN. El archivo as ledo se incorporar al editor de programa. Ejemplo: Los siguientes cantidad de flores a los 60 das en plantas de dos variedades de geranio, A y B. Grupo A: 4, 3, 7, 5, 2, 9, 1 Grupo B: 6, 4, 10, 12, 7, 5, 10
data a; input grupo $ y; datalines; A 4 A 3 A 7 A 5 A 2 A 9 A 1 B 6 B 4 B 10 B 7 B 12 B 5 B 10 proc ttest; class grupo; var y; proc anova; class grupo; model y=grupo; run;

Uso de MS Excel para manejo elemental de datos


Excel es un programa general de hoja de datos que permite, entre otras cosas, entrada y manejo de datos, grficos, creacin de bases de datos, clculos estadsticos, etc. Los datos que estn disponibles en Excel pueden leerse directamente en otros programas, como SAS o InfoStat. La entrada de datos se realiza por columnas (cada columna representa una variable). La primera fila se usa tpicamente para los nombres de cada variable. Como ejemplo vamos a introducir unos datos de rendimiento de trigo bajo distintos niveles de fertilizacin con nitrgeno.

Nitrg. Repetic. 40 1 40 2 40 3 80 1 80 2 80 3 120 1 120 2 120 3 160 1 160 2 160 3 200 1 200 2 200 3 240 1 240 2 240 3

Rendim. 42 41 40 45 44 45 49 45 47 49 51 49 50 49 51 46 45 45

Para realizar clculos slo es necesario escribir la frmula una vez (en la primera celda), y despus se copia la misma en las otras celdas. Por ejemplo, una vez entrados los datos supongamos que deseamos calcular el costo de la fertilizacin. Para ello deberamos multiplicar la cantidad de nitrgeno por el costo de una unidad de fertilizante. Supongamos que el costo de una unidad es $1.23. Entonces debemos multiplicar cada valor en la primera columna por 1.23. Primero nos ubicamos en una columna nueva (que podemos titular costo) y nos ubicamos en la celda 2. Oprimimos en el smbolo = en la lnea de comandos, escribimos =A2*1.23 y oprimimos ENTER. Ahora nos ubicamos nuevamente en la celda que acabamos de calcular, y oprimimos edit, copy o marcamos el cono correspondiente. Seleccionamos ahora todas las celdas para las que queremos realizar el mismo clculo (en nuestra columna van a ser las celdas 3 a 19) manteniendo el botn izquierdo del mouse apretado. El rea seleccionada va a aparecer en negro. Para hacer paste seleccionamos edit, paste. Tambin es posible usar el men FORMULA en Excel 2007.

Formas del comando INPUT en SAS data uno; input tratam $ repet altura peso; datalines; control 1 65 150 control 2 60 125 control 3 68 170 tratado 1 70 140 tratado 2 . 150 tratado 3 68 155 proc print; proc print data=uno; var tratam altura peso; run; data dos; input spp $ 1-5 rendim1 7-9 prot1 11-13 fibra1 15-17 ceniza1 19-21 rendim2 23-25 prot2 27-29 fibra2 31-33 ceniza2 35-37; datalines; sorg 124 12 23 5 145 11 25 6 sorg 114 . 21 4 139 11 24 5 sorg 114 13 22 5 143 10 26 5 panic 109 14 23 6 135 11 25 6 panic 114 13 21 7 144 10 24 7 run;

data cuatro; input fact1 fact2 fact3 datalines; 1 1 1 1 23 1 1 1 2 26 1 1 2 1 1 28 1 2 1 2 29 1 2 1 1 1 22 2 1 1 2 28 2 2 2 1 1 24 2 2 1 2 25 2 run;

repet y @@; 1 2 1 2 1 1 1 1 3 3 3 3 28 27 25 28 1 1 2 2 1 2 1 2 2 2 2 2 1 1 1 1 20 26 22 25 1 1 2 2 1 2 1 2 2 2 2 2 2 2 2 2 27 25 23 22 1 1 2 2 1 2 1 2 2 2 2 2 3 3 3 3 30 28 26 29

Otros comandos en DATA 1. Para leer los datos de un archivo externo podemos usar el comando INFILE:
data aaaa; infile 'E:\DATOS.TXT' firstobs=3 OBS=3214 DELIMITER=',' ; input ...; run;

2. Lneas y bloques de comentarios. Al colocar un * todo lo que queda hasta el primer ; no se ejecuta . Al colocar un /* todo lo que queda hasta encontrar un */ no se ejecuta. 3. Formatos. Si se desea asociar un formato con una variable se pueden usar el INFORMAT (formato de entrada) o el FORMAT. El informat se puede especificar antes del comando INPUT o dentro del comando INPUT. Ejemplos:
data jansale1; informat item $10. amount 5.2; input item amount comm; datalines; data jansale2; input item $10. amount 5.2 comm; datalines; data jansale3; informat item $10. amount 5.2; input item amount comm; format item $9. amount comma5. comm comma8.; datalines; FORMATS e INFORMATS principales: w.d dollarw.d $w. datew. mmddyyw. yymmddw. Ejemplo: data a; informat day1 date10.; input day1; format day1 ddmmyy8.; datalines; 1JAN76 01FEB82 6MAR78 10-AUG-1998 proc print; run;

4. Seleccin de observaciones: if if if if aa=1; 25<mpg<35; pais=JAPON or pais=BRASIL; tratam=1 then delete;

5. Transformando variables: y=(sqrt(y)-5)**2+x; 6. Creando nuevas variables: if if if if 50<=mpg then millaje=excelente; 30<=mpg<50 then millaje=bueno; 20<=mpg<30 then millaje=regular; .<mpg<20 then millaje=malo;

7. Leyendo otro data set: data dos; set uno; if x<5; run; 8. Creando data sets permanentes: libname db e:\curso\ejemplos; data db.perma; set a; run; 9. Incluyendo o excluyendo variables: data tres; set dos; keep a1 a2 trat; data tres; set dos; drop a1 a2 trat;

11. Combinando datasets. Comandos merge y set. Supongamos que tenemos los siguientes data sets en SAS: DATA UNO: OBS 1 2 3 X 1 2 1 Y 1 4 2 Z 3 2 5

DATA DOS: OBS 1 2 X 3 1 A 2 4

Ahora corremos los siguiente comandos: data tres; set uno dos; data cuatro; merge uno dos; proc sort data=uno; by x; proc sort data=dos; by x; data cinco; merge uno dos; by x; run; Observar cules seran los resultados en cada caso.

Potrebbero piacerti anche