Sei sulla pagina 1di 9

Temario

Introduccin al uso de R. Obtencin de R. Instalacin de R.

Uso de editores externos, TinnR.

Caractersticas bsicas del lenguaje de R

Paquetes y funciones de Estadstica descriptiva:

Resumen de la informacin, medidas de posicin y dispersin. Herramientas de calculo


organizacin de la informacin, tablas, grficos.

Paquetes y funciones de Estadstica Inferencial:

Intervalo de confianza. Pruebas de hiptesis.

Utilizacin del paquete Rcmdr.

Aplicacin de R Teresa Boca; Ana Birchmeier 1


Introduccin al uso de R
R es un soft muy flexible. Los procedimientos estadsticos estndar se pueden aplicar con slo
utilizar el comando apropiado. Adems, existen multitud de libreras programadas por los usuarios de
todo el mundo para llevar a cabo procedimientos ms especficos. En ltima instancia, podemos
programar nuestros propios procedimientos y aplicaciones.

Los beneficios de utilizar R


R se utiliza como un lenguaje de programacin que permite saber que se hace en cada paso.
Los anlisis que se pueden realizar con R son igualmente de potentes al de cualquier
programa comercial.
Presenta un entorno grfico e alta calidad y capacidad.
Es un programa libre, su par comercial es S-Plus.
El lenguaje de programacin es sencillo.
Tiene la capacidad de combinar, anlisis "empaquetados" (ej., una regresin logstica) con
anlisis especficos para cada situacin.
Tambin tiene la capacidad de manipular y modificar datos y funciones.
Extensiones especficas a reas nuevas (bioinformtica, geoestadstica, modelos grficos).
Un medio de transferencia de tecnologa/conocimiento

Obtencin de R
El sitio web se encuentra en la direccin:
http://www.r-project.org/.

Desde este sitio se debe seleccionar el


CRAN (sitio) desde donde se desea obtener
los archivos del programa
hacer click en
CRAN CRAN - the Comprehensive R Archive
Network
Sitios a Australia; Brasil ; Canad ;
Dinamarca ; Francia ; Hungra, Japn;
Sudfrica; Suiza; Switzerland ; Reino
Unido; EEUU .Los CRAN tienen
distribuciones para Windows 95, 98, ME y
2000 para Intel o MacIntosh y varios Linux.
Las actualizaciones son frecuentes cada 3 meses aproximadamente.

Una vez seleccionado en CRAN, se debe seleccionar la versin (Linux, Mac, Windows...)

En la ventana siguiente aparecen dos


subdirectorios, uno tiene el archivo del
programa (ejecutable) base y el otro el
cdigo fuente contrib.
Para la instalacin del programa
necesitamos el archivo base.

hacer click
Windows(95
and later)

Aplicacin de R Teresa Boca; Ana Birchmeier 2


hacer click en
base

hacer click
R-2.9.1-
win32.exe

La instalacin bsica contiene paquetes o mdulos con funciones y procedimientos para la


realizacin de grficos, procedimientos estadsticos y utilidades para el manejo de datos como:
base, graphics, stats, utils. Existen muchos paquetes adicionales.
Para adicionar paquetes es necesario seleccionarlos desde un CRAN:

hacer click
Packages

Aplicacin de R Teresa Boca; Ana Birchmeier 3


Podemos seleccionar el package (paquete) que deseamos, por ejemplo si queremos agregar el
Rcmdr:

hacer click
Rcmdr

En la pgina de cada paquete vamos a encontrar informacin acerca de:


Versin de R, otros packges adicionales necesarios, datos del autor, el cdigo fuente ( Rcmdr 1.5-
6. tar.gz), el archivo del programa (Rcmdr 1.5-6.zip) y el manual de referencia Rcmdr.
Para agregarlo, podemos hacerlo guardando el archivo en una carpeta especifica en nuestra PC, y
aadirlo desde la consola de R.

Una vez instalado R aparecer, al abrirlo aparecer la siguiente consola:

Aplicacin de R Teresa Boca; Ana Birchmeier 4


En el men principal, abrimos Packages e instalamos los packages adicionales siguiendo las
instrucciones de las pantallas.

Tinn R, editor de R

Como veremos ms adelante, las sentencias necesarias para la ejecucin de los distintos anlisis
deben escribirse en la consola de R, pero existen Editores externos que facilitan esta tarea, uno de
ellos es el TinnR acrnimo de 'This is not Notepad'. Se trata de un editor de cdigo abierto y libre.
Tiene caractersticas interesantes y est especialmente orientado a R, pero que se puede utilizar
tambin con otros lenguajes de programacin populares.

Aplicacin de R Teresa Boca; Ana Birchmeier 5


Una de las caractersticas principales de Tinn-R es el resaltado de sintaxis, que permite una mayor
claridad al escribir cdigo. Esta caracterstica no slo es para R, sino para varios de los lenguajes de
programacin ms comunes, los cuales tambin puede manejar, como C++, Java, HTML y Python.
Este paquete de distribucin gratuita que se puede obtener en: http://www.sciviews.org/Tinn-R/

Al hacer clic en
este icono se
abrir R, como
Con esto iconos ejecutaremos una ventana.
los comandos envindolos a la
consola de R. En esta ventana escribiremos
los comandos necesarios para
el anlisis a realizar.

Recorriendo con el Mouse los distintos iconos del men se puede obtener informacin sobre los
mismos.

Trabajar con este editor, presenta varias ventajas, como se mencion anteriormente resalta en
colores diferentes la sntesis, los archivos se guardan con extensin txt y son ms simples de
almacenar, cuanta con ayuda de fcil acceso para las distintas funciones, etc.

NOTA: La Instalacin de Tinn_R bajo algunas versiones de Windows XP o Vista, puede tener
algunas incopatibilidades, las distintas opciones para solucionarlas son:
(http://sourceforge.net/forum/forum.php?forum_id=864071)

Caractersticas bsicas del lenguaje de R


R es un lenguaje orientado a objetos. Esto significa que los diferentes objetos a los que se
aplican los comandos de R tienen ciertas caractersticas y atributos. Cada comando reconoce estos
atributos y acta de diferente forma en funcin de ellos. Es decir, el mismo comando aplicado a
diferentes tipos de objetos hace cosas diferentes.

No es necesario predefinir el modo de un objeto, sino que R lo establece de acuerdo con la


asignacin que hagamos. Para asignar el valor 2.3 al objeto x, debemos teclear x <- 2.3. Si ahora
usamos mode(x), R nos dir que x es numeric porque es un nmero. Sin embargo, si escribimos x
<- silla, entonces mode(x) devuelve un carcter (carcter).

Una lista de todos los objetos que se encuentran en la memoria de trabajo se obtiene mediante el
comando ls().

Si se teclea el nombre de un objeto se puede ver su contenido.


Aplicacin de R Teresa Boca; Ana Birchmeier 6
Obtencin de ayuda en R
Algunas posibilidades en R para obtener ayuda son:

a.-Tecleando help(nombre de comando) se abre una ventana con informacin sobre un comando
especifico. Pruebe, por ejemplo tipear el siguiente comando: help(mean).
b.- Otro comando muy til es help.search (palabra clave). En este caso obtenemos una lista de los
comandos relacionados con palabra clave. Por ejemplo, teclea help.search(median) y obtendrs una
lista de comandos de R relacionados con la mediana.
c.- Finalmente, una forma de obtener ayuda en formato html consiste en teclear
help.start().
d.- Para conocer como funciona cualquier funcin de R, tipee en la consola principal el signo ? y el
nombre de la funcin. Por ejemplo ? plot( ) nos mostrar como funciona la funcin plot.

Tipos de datos
R trabaja con objetos los cuales tienen nombre, contenido y atributos.
El atributo especifica el tipo de datos representados por el objeto. Para entender la utilidad de estos
atributos, consideremos una variable que toma los valores 1, 2, o 3, tal variable podra ser un
nmero entero, o el cdigo de una variable categrica.
Los resultados de un anlisis estadstico de esta variable no ser el mismo en ambos casos: los
atributos del objeto proporcionan la informacin necesaria. En general, la accin de una funcin
sobre un objeto depende de los atributos de este ltimo.
Todo objeto tiene dos atributos intrnsecos: tipo y longitud.
El tipo se refiere a la clase de los elementos en el objeto; numrico, carcter, complejo, y lgico
(FALSE [Falso] or TRUE [Verdadero]).
La longitud es simplemente el nmero de elementos en el objeto.

Las funciones mode( ) y length( ), reportan el tipo y longitud del objeto.

Ejemplos de distintos objetos R.

varios
objeto tipo Descripcin tipos de
datos?
numrico, alfabtico, una variable en el significado
vector No
complejo o lgico comnmente asumido
factor numrico o
factor una variable categrica. No
alfabtico
numrico, alfabtico
arreglo (array) una tabla de dimensin k. No
complejo o lgico
numrico, alfabtico,
matriz (matrix) un caso particular de un arreglo
complejo o lgico No
donde k = 2.
un (marco o base de datos) es una
tabla compuesta de uno o ms
numrico, alfabtico,
data.frame vectores y/o factores de la misma Si
complejo o lgico
longitud pero que pueden ser de
diferentes tipos
una serie temporal y como tal
ts numrico, alfabtico,
contiene atributos adicionales tales Si
complejo o lgico
como frecuencia y fechas.
numrico, alfabtico puede contener cualquier tipo de
lista (list) Si
complejo, lgico objeto incluyendo otras listas!

Aplicacin de R Teresa Boca; Ana Birchmeier 7


Los tipos de objetos ms importantes para nuestros propsitos son: vectores, matrices, listas y
ficheros de datos (data frames). Hay muchos paquetes que definen sus propios objetos, como el
caso de los paquetes para anlisis geoestadisticos.

Vectores y matrices
Si queremos, por ejemplo, que el objeto x contenga el vector (2, 1, 3.6, 5), debemos usar el
comando c (que alude a combinar) para hacer la siguiente asignacin:
x <- c(2,1,3.6,5).

Una sucesin regular de nmeros se puede obtener de la siguiente forma:


x <- 1:10
x
1 2 3 4 5 6 7 8 9 10

Si queremos cambiar el incremento:


x <- seq(1,10,2)
x
13579
En el comando seq el primer argumento indica el punto inicial de la sucesin, el segundo el punto
final, y el tercero el incremento.
Es muy fcil generar con R sucesiones de nmeros aleatorios. El programa utiliza funciones de la
forma rdistribucion(n,lista de argumentos) para generar n observaciones de una larga lista de
distribuciones.
Para R, una matriz no es ms que un vector con un atributo adicional que contiene el nmero de filas
y columnas. Por lo tanto una matriz se puede crear a partir de un vector, aadiendo informacin
sobre el nmero de filas y columnas de la matriz. Por ejemplo, el siguiente comando puede utilizarse
para generar aleatoriamente 1000 datos con distribucin normal estndar que, a su vez, forman una
matriz x con dimensin 10 100:
x <- matrix(rnorm(1000),nrow=10,ncol=100)

Si creamos una matriz x y queremos extraer alguno de sus elementos, podemos usar x[i,j], donde (i,
j) son la fila y la columna del elemento. Para extraer la tercera fila de la matriz y guardarla en el
vector y se escribe y <- x[3,], es decir si no especificamos la columna, R entiende que queremos
todas las columnas.

Listas
Las listas son conjuntos heterogneos de objetos, a los que por alguna razn conviene tener
juntos y darles un nombre. Las salidas de muchas funciones que llevan a cabo procedimientos
estadsticos son listas, ya que incluyen resultados numricos, grficos, etc. Para crear una lista
llamada resultados que contenga los objetos x1, x2,... basta utilizar
resultados <- list(x1,x2,...)

Ficheros de datos (Data Frame)


Leer un fichero de texto con datos
Para leer un fichero de texto fichero.txt en el que se encuentran los datos con los que queremos
trabajar se usa el comando

datos <- read.table(c:\\camino\\fichero.txt,header=T)

Este comando genera un fichero de datos (un objeto del tipo data frame) con el nombre elegido. Las
barras del camino deben de ser dobles. El argumento header se utiliza para indicar si la primera fila
contiene (T) o no (F) los nombres de las variables. Por ejemplo, distintas variables relacionadas con

Aplicacin de R Teresa Boca; Ana Birchmeier 8


el nivel de vida y grado de desarrollo de 91 pases del mundo se encuentran en el fichero de texto
paises.txt. Supongamos que el fichero lo tenemos en la carpeta datos den el disco c:.
Entonces, para leer el fichero y almacenarlo en un data frame que tambin llamamos pases, usamos

paises <- read.table(c:\\datos\\paises.txt,header=T)

Funciones Matemticas
Podemos encontrar todas las funciones matemticas, en la siguiente tabla podemos ver
algunos ejemplos.

log(x) logaritmo de base e de x


exp(x) antilogaritmo de x de base e
log(x,n) logaritmo de base n de x
log10(x) logaritmo de base 10 de x
sqrt(x) raiz cuadrada de x
factorial(x) igual a x!
round(x, digits=0) redondea el valor de x a un entero
signif(x, digits=6) igual a x con 6 digitos en notaciones cientifica
runif(n) genera n nmeros aleatorios entre 0 y 1 para una distribucin
uniforme
cos(x) coseno de x
sin(x) seno de x
abs(x) valor absoluto de x

Aplicacin de R Teresa Boca; Ana Birchmeier 9

Potrebbero piacerti anche