Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Teresa Boca
INTA-FAUBA
2010
Teresa Boca
2
INTA-FAUBA 2010
Los beneficios de utilizar R
Teresa Boca
3
INTA-FAUBA 2010
Obtencin de R
Seleccionar el
CRAN
Teresa Boca
4
INTA-FAUBA 2010
Obtencin de R
Teresa Boca
5
INTA-FAUBA 2010
Obtencin de R
Seleccionar el
sistema
operativo
Teresa Boca
6
INTA-FAUBA 2010
Obtencin de R
Hacer click en
base
Obtencin de R
Hacer click
Obtencin de Tinn R, editor de R
Teresa Boca
9
INTA-FAUBA 2010
Obtencin de Tinn R, editor de R
http://sourceforge.net/projects/tinn-r/
Teresa Boca
10
INTA-FAUBA 2010
Caractersticas bsicas
Lenguaje R
Teresa Boca
11
INTA-FAUBA 2010
Caractersticas bsicas
Obtencin de ayuda en R
Teresa Boca
12
INTA-FAUBA 2010
Caractersticas bsicas
Tipos de datos
Teresa Boca
13
INTA-FAUBA 2010
Caractersticas bsicas
varios
objeto tipo Descripcin tipos de
datos?
numrico, alfabtico, una variable en el significado
vector No
complejo o lgico comnmente asumido
factor numrico o
factor una variable categrica. No
alfabtico
numrico, alfabtico
arreglo (array) una tabla de dimensin k. No
complejo o lgico
numrico, alfabtico, un caso particular de un arreglo
matriz (matrix) No
complejo o lgico donde k = 2.
un (marco o base de datos) es una
tabla compuesta de uno o ms
numrico, alfabtico,
data.frame vectores y/o factores de la misma Si
complejo o lgico
longitud pero que pueden ser de
diferentes tipos
Vectores y matrices
Si queremos, el objeto x se el vector (2, 1, 3.6, 5), debemos usar el comando c (que
alude a concatenar)
x <- c(2,1,3.6,5).
x <- 1:10
x
1 2 3 4 5 6 7 8 9 10
Teresa Boca
15
INTA-FAUBA 2010
Caractersticas bsicas
x <- matrix(rnorm(1000),nrow=10,ncol=100)
Teresa Boca
16
INTA-FAUBA 2010
Caractersticas bsicas
Listas
Las listas son conjuntos heterogneos de objetos, a los que por alguna razn
conviene tener juntos y darles un nombre.
Para crear una lista llamada resultados que contenga los objetos x1, x2,...
basta utilizar
Teresa Boca
17
INTA-FAUBA 2010
Caractersticas bsicas
Para leer un fichero de texto fichero.txt en el que se encuentran los datos con los
que queremos trabajar se usa el comando
Este comando genera un fichero de datos (un objeto del tipo data frame) con el
nombre elegido.
Las barras del camino deben de ser dobles. El argumento header se utiliza para
indicar si la primera fila contiene (T) o no (F) los nombres de las variables.
Teresa Boca
18
INTA-FAUBA 2010
Caractersticas bsicas
Funciones Matemticas
Teresa Boca
19
INTA-FAUBA 2010
Utilizacin del paquete Rcmdr
R Packages Rcmdr
Consiste de una barra men, una barra de herramientas, una ventana log/script
y una ventana de salida.
Teresa Boca
20
INTA-FAUBA 2010
Anlisis descriptivo de datos espaciales
Estadstica descriptiva
Diagramas y grficos
Histogramas
QQPlot y PPPlot
Grficos de dispersin (Scatter plot)
H-Grfico de dispersin
Teresa Boca
22
INTA-FAUBA 2010
Anlisis descriptivo de datos espaciales
scatterplot3d: Grficos en R3
normalidad
Teresa Boca
23
INTA-FAUBA 2010
Anlisis descriptivo de datos espaciales
contiene alturas de la cabeza piezomtrica (en pies sobre el nivel del mar)
212)].
Teresa Boca
24
INTA-FAUBA 2010
Iniciando la seccin en R, paquetes necesarios
Para cargar las libreras y que estn disponibles para nuestro anlisis se utiliza el
comando library (nombre_del_paquete) .
library(akima);library(geoR);library(gstat);library(lattice)
library(moments);library(spatial);library(scatterplot3d);
library(nortest); library(Rcmdr)
Teresa Boca
25
INTA-FAUBA 2010
Leyendo los datos
header=TRUE el archivo tiene una fila con los nombres de las variables.
sep= indica como estn separados los datos (en este caso por espacios),
na.strings= determina que valor se le asigna a los datos faltantes,
dec= determina cual es el separador decimal y
strip.white = permite el despojo de los espacios en blanco previos y
posteriores en los campos de texto.
str(aquifer)
Teresa Boca
26
INTA-FAUBA 2010
Resumen de estadsticas descriptivas
100% n
easting 112.8045 85
northing 184.7664 85
head 3571.0000 85
Teresa Boca
27
INTA-FAUBA 2010
Resumen de estadsticas descriptivas
summary(aquifer)
summary(aquifer)
easting northing head
Min. :-145.24 Min. : 9.414 Min. :1024
1st Qu.: -21.30 1st Qu.: 33.682 1st Qu.:1548
Median : 11.66 Median : 59.158 Median :1797
Mean : 16.89 Mean : 79.361 Mean :2002
3rd Qu.: 70.90 3rd Qu.:131.825 3rd Qu.:2540
Max. : 112.80 Max. :184.766 Max. :3571
Teresa Boca
28
INTA-FAUBA 2010
Resumen de estadsticas descriptivas
resumen pero solo para las alturas de la cabeza piezomtrica del acufero.
numSummary(aquifer[,"easting"],statistics=c("mean", "sd",
"quantiles"), quantiles=c(0,.25,.5,.75,1))
summary(aquifer$easting)
Teresa Boca
29
INTA-FAUBA 2010
Resumen de estadsticas descriptivas
En el paquete moments, existe una funcin que nos permite obtener los
momentos deseados solo poniendo el orden requerido
[1] 1.000000e+00
2.002282e+03
4.378474e+06
1.035859e+10
2.620486e+13
Teresa Boca
30
INTA-FAUBA 2010
Resumen de estadsticas descriptivas
Teresa Boca
31
INTA-FAUBA 2010
Grficos descriptivos
?plot()
Description
Generic function for plotting of R objects. For more details about the graphical
parameter arguments, see par.
Usage
plot(x, y, ...)
Arguments
x: the coordinates of points in the plot. Alternatively, a single plotting structure,
function or any R object with a plot method can be provided.
y: the y coordinates of points in the plot, optional if x is an appropriate structure.
... Arguments to be passed to methods, such as graphical parameters (see
par). Many methods will accept the following arguments:
type
what type of plot should be drawn. Possible types are
"p" for points,
"l" for lines,
.
Teresa Boca
32
Comportamiento de la variable observada en funcin de las
coordenadas
par(mfrow=c(1,2))
plot(aquifer$easting, aquifer$head, ylab="cabezas piezomtricas",
xlab="latitud")
plot(aquifer$northing, aquifer$head, ylab="cabezas piezomtricas",
xlab="longitud")
par(mfrow=c(1,1))
Teresa Boca
33
INTA-FAUBA 2010
Histogramas
Teresa Boca
34
INTA-FAUBA 2010
Box Plot
boxplot(aquifer$head, ylab="head")
Teresa Boca
35
INTA-FAUBA 2010
h Scatter-plot
Teresa Boca
36
INTA-FAUBA 2010
h Scatter-plot
aquifer_sp<-SpatialPoints(aquifer)
hscat((head)~1 ,aquifer_sp, c(10, 20, 100, 120,180))
Teresa Boca
37
INTA-FAUBA 2010
Evaluacin de normalidad
ad.test(aquifer$head)
data: aquifer$head
A = 1.6652, p-value = 0.0002620
lillie.test(aquifer$head)
data: aquifer$head
D = 0.1553, p-value = 2.784e-05
Teresa Boca
38
INTA-FAUBA 2010
Evaluacin de normalidad
El grfico QQ plot, compara los cuantiles de los datos muestrales y los con
los cuantiles de la distribucin normal terica con parmetros dados por la
media y desviacin estndar muestral.
Teresa Boca
39
INTA-FAUBA 2010
Transformaciones
Transformacin de Box-Cox:
Para respuestas y positivas, Box y Cox (1964) propusieron la familia de
transformaciones de potencias con un parmetro desconocido > 0, tal
que:
y 1
0 y0
t
ln y 0
library(MASS); library(TeachingDemos)
boxcox((aquifer$head)~1, lam=seq(-1,1,l=21), plotit=TRUE)
Transformaciones
aquifer$head_box<-bct(aquifer$head,0.125)
par(mfrow=c(2,2))
qqnorm(aquifer$head); qqnorm(aquifer$head_box)
hist(aquifer$head); hist(aquifer$head_box)
par(mfrow=c(1,1))
shapiro.test(aquifer$head)
shapiro.test(aquifer$head_box)
data: aquifer$head
W = 0.947, p-value = 0.001586
data: aquifer$head_box
W = 0.9674, p-value = 0.03023
Diagramas de dispersin de los datos
El parmetro
type=n en la funcin plot slo
dibuja los ejes con los valores de las
coordenadas easting y northing.
text ubica cada uno de los labels de
las clases generadas con la funcin
cut.
cex=1 define el tamao del label
dentro del grfico.
Grficos con datos geoespaciales
Para que R entienda y trate los datos como geoespaciales debe indicrsele
mediante el comando as.geodata del paquete geoR.
aquifer1= as.geodata(aquifer,coords.col=1:2,data.col=3)
points(aquifer1)
points(x, coords=x$coords,
data=x$data, data.col = 1, borders,
pt.divide=c("data.proportional","rank
.proportional", "quintiles",
"quartiles", "deciles", "equal"),
lambda = 1, trend = "cte)
Grficos con datos geoespaciales
points(aquifer1, pt.div="equal")
points(aquifer1, cex.min=.6, cex.max=.6)
points(aquifer1, cex.min=.3, cex.max=3)
Grficos con datos geoespaciales
plot(aquifer1)
int.aq=interp(x=aquifer$easting,y=aquifer$northing,z=aquifer$head)
contour(int.aq)
points(aquifer$easting,aquifer$northing)
Grficos de interpolacin
levelplot(int.aq$z)
image(int.aq)
Grficos de interpolacin
persp(int.aq$x,int.aq$y,int.aq$z,xlab="easting",ylab="northing",zl
ab="head",phi=30,theta=20,col="lightblue",expand=.5,
ticktype="detailed")
Grficos en 3 dimensiones
cloud(aquifer$head~aquifer$easting*aquifer$northing)