Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
NÚCLEO DE MONAGAS
Fecha: 25 de junio del 2011, desde las 8:00 am hasta las 5:00 pm
R está disponible como software libre bajo los términos de la GNU Free Software
Foundation Licencia Pública General en forma de código fuente. Se compila y se ejecuta en
una amplia variedad de plataformas UNIX y sistemas similares (como FreeBSD y Linux),
Windows y MacOS.
El software estadístico “R” (R Project), puede ser descargado de manera gratuita a través de
la siguiente dirección electrónica: http://cran.r-project.org/bin/windows/base/
La versión a descargar es la 2.13 (la última hasta ahora), las cuales presentas dos versiones
dependiendo de la arquitectura del sistema operativo que utilice el usuario, en este caso
Windows xp. Las mencionadas arquitecturas son de 32 y 64 bits.
Una vez instalado el programa, el usuario puede incrementar el poder gráfico o estadístico
de “R” mediante la instalación de librerías denominadas “paquetes” (packages). Cada
paquete posee instrucciones específicas para el análisis bien sea gráfico o estadístico que el
usuario desee realizar y que la versión instalada de “R” por sí sola no puede hacer.
Existen varias maneras de instalar los mencionados paquetes. La primera de ellas consiste
en acceder al menú PAQUETES de “R” y seleccionar la opción “Instalar paquete (s)”.
Seguidamente es necesario seleccionar un “depositario” (lugar donde se encuentran los
paquetes) para posteriormente ubicar en una lista ordenada alfabéticamente el paquete que
necesitamos (Figura 2). Posteriormente se selecciona el mismo y a medida que termine la
descarga del paquete, este se instalará en el software.
Una vez ingresado en dicha página web, se selecciona la opción “packages” (paquetes).
Seguidamente se desplegará una lista en orden alfabético en donde se muestran todos los
paquetes disponibles. Basta con seleccionar el deseado y seleccionar la opción “Windows
binary” si fuera el caso del sistema operativo presente en nuestra pc.
AÑO ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Una de las maneras de introducir un conjunto de datos en “R” es a través de vectores. Los
mismos son una cadena de caracteres que comienzan con el comando “c” seguida de un
paréntesis y al finalizar el conjunto de datos, se cierra el paréntesis. Lo dicho anteriormente
se aprecia con más claridad en el código que a continuación se muestra, introduciendo los
valores tomados de la tabla anterior, específicamente los valores del año 1941, desde el mes
de enero hasta el mes de diciembre.
precipitación= c (63, 18, 9, 0, 66, 227, 199, 100, 47, 84, 74, 76)
Cada uno de los valores introducidos, debe estar separado por una coma “,” ya que para el
software, dicho símbolo es el separador de caracteres. Para ingresar un número decimal,
basta con ingresar un punto “.” como separador de decimales.
El vector antes mencionado puede ser llamado de acuerdo al usuario, colocando letras
mayúsculas o minúsculas y palabras acentuadas o no. Es de acotar que si son utilizadas
palabras complejas, las mismas deben ser utilizadas para “llamar” al conjunto de datos de
interés durante todo el análisis realizado en el programa.
mean (promedio)
var (variancia)
sd (desviación estandar)
max (valor máximo)
min (valor mínimo)
summary (resumen)
mean (precipitación)
[1] 80.25
var (precipitación)
[1] 4826.932
sd (precipitación)
[1] 69.47612
max(precipitación)
[1] 227
min(precipitación)
[1] 0
summary (precipitación)
Figura 4. Gráfica de barras una vez modificada la etiqueta del eje X & Y
Tinn-R es un software de dominio público cuyo objetivo es hacer más ameno el ambiente
del usuario cuando se trata de programación en lenguaje C. Es por esta razón, que Tinn-R
es utilizado como un gestor de códigos para “R” y una vez construidos, el mismo en
enviado al programa antes mencionado y así no tener que escribir las líneas de comando
repetidas veces en cada ocasión que se requiera un análisis bien sea estadístico o gráfico
similar.
Cada una de las columnas del conjunto de datos mencionado anteriormente puede ser
analizadas por serado a través de los comandos estadísticos ya conocidos (mean, var, sd,
min, max, summary). Para generar un gráfico de barras múltiple (que contenga todos los
valores importados) es necesario transformar el conjunto de datos mediante el comando
as.matrix y luego utilizar el comando barplot. Es código para generar dicho gráfico es el
siguiente:
Gráficos circulares.
El comando comúnmente utilizado para hacer gráficos circulares es denominado pie (tarta o
torta). Dicho código posee ciertos caracteres para personalizar el gráfico resultante, los
cuales se describen a continuación.
pie (x, labels = names(x), shadow = FALSE, edges=200, radius=0.8, col=NULL, main=
NULL, ...)
1. x: Vector de cantidades positivas, los cuales son presentados como las áreas en el
gráfico.
2. labels: Un vector de caracteres “strings” que dan nombres a las áreas.
3. shadow: Un vector lógico que indica si un efecto de sombrea será aplicado para el
gráfico, cuando se utilizan colores de relleno.
5. radius: La torta es dibujada centrada en una caja cuadrada cuyos lados se mueven
de -1 a 1. Si se usan etiquetas largas puede ser necesario usar radios más pequeñoos.
Para ilustrar un ejemplo de cómo realizar un gráfico circular, se utilizó el código que a
continuación se menciona, utilizando los datos de mes de Enero (ENE) desde 1941-1946
presentes en la tabla 1.
Gráficos de superficie.
Uno de los gráficos de superficie clásicos se puede realizar instalando el paquete lattice. La
base de datos a utilizar es el modelo digital de elevación (MDE) descargado de la página
web de la GLCF de la cuenca del río Aréo.
Dicho MDE fue manipulado con el software de dominio público Grass Gis y exportado del
mismo en formato xyz para ser analizado gráficamente en “R”.
El código para visualizar el gráfico de superficie de una parte del MDE de la cuenca del río
Aréo es el siguiente:
mde=read.table("srtm2.r", header=T)
attach(mde)
summary(mde)
wireframe (cota [1:20000] ~ este [1:20000] * norte [1:20000], data = mde, xlab =
"Coordenada Este", ylab = "Coordenada Norte", zlab="Cota", main = "Gráfico de
superfice. Cuenca del río Areo", drape = TRUE, col.regions = terrain.colors(100), screen
= list(z = -30, x = -70))
levelplot (cota ~ este * norte, data = mde, xlab = "Coordenada Este", ylab = "Coordenada
Norte", zlab="Cota", main = "Gráfico de superfice. Cuenca del río Areo", col.regions =
terrain.colors(100))
La gráfica anterior puede ser analizada en 3D mediante la instalación del paquete rgl. El
mismo, permite un ploteo en 3D de todo en conjunto de puntos que integran el MDE de la
cuenca en cuestión. El código utilizado y la gráfica resultante se muestran a continuación.
points3d(este,norte,4*cota, col="black")
Gráficos de caja.
El software estadístico “R” posee la habilidad de generar gráficas de caja a través del
comando boxplot. Dicho gráfico es representado por un rectángulo que se encuentra unido a
dos líneas paralelas a través de una línea vertical que por lo general es punteada o
segmentada. Los valores observados en el gráfico (de abajo hacia arriba) son los siguientes:
Histogramas.
Introducción.
Los modelos de diseño de experimentos son modelos estadísticos clásicos cuyo objetivo es
averiguar si unos determinados factores influyen en una variable de interés y, si existe
influencia de algún factor, cuantificar dicha influencia.
Unos ejemplos donde habría que utilizar estos modelos son los siguientes:
Prueba de T.
̅ − 𝛍𝟎
𝐘
𝐭= 𝐒
𝐘
En donde:
∑ 𝒀𝒊
̅=
𝒀
𝒏
𝑺 𝑺
=
𝒀 √𝒏
En donde:
S = desviación típica.
n = número de observaciones.
𝑺 = √𝑺𝟐
En donde:
S2 = variancia.
(∑ 𝒀𝒊 )𝟐
∑ 𝒀𝒊 𝟐 −
𝒏
𝑺𝟐 =
𝒏−𝟏
días
108
124
124
106
115
138
163
159
134
139
Código utilizado:
attach (datos1)
pruebaT
ANÁLISIS DE DOS MUESTRAS.
En donde:
Código utilizado:
attach (datos2)
datos2
pruebaT
Prueba de homogeneidad de varianza.
pruebaF
Diseño completamente aleatorizado (DCA).
Insecticida Observaciones
1 72 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69
Código utilizado:
attach (datos4)
datos4
summary (DCA)
Fuente de
Df Sum Sq Mean Sq F value Pr(>F)
variación
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
1 - 0.1 = ns
Código utilizado:
attach (datos)
datos
summary (DBA)
Fuente de
Df Sum Sq Mean Sq F value Pr(>F)
variación
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Diseño de cuadrado latino (DCL).
Los factores bloque están cruzados cuando existen unidades experimentales en todas las
combinaciones posibles de los niveles de los factores bloques.
Carro
Posición
1 2 3 4
DD C 12 D 11 A 13 B 8
DI B 14 C 12 D 11 A 3
TD A 17 B 14 C 10 D 9
TI D 13 A 14 B 13 C 9
attach (datos)
datos
summary (DCL)
Fuente de
Df Sum Sq Mean Sq F value Pr(>F)
variación
6 30.375 5.062
Residuals
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Para investigar el efecto que tienen el tipo de pintura tapaporos y el método de aplicación
sobre la adhesión de la pintura, se realiza un diseño factorial. Para ello, se pintan tres
muestras con cada tapaporo utilizando cada método de aplicación, después se aplica una
capa final de pintura y a continuación se mide la fuerza de adhesión. Los datos son los
siguientes:
Métodos
Pinturas
Inmersión Rociado
attach (datos)
datos
summary (DAF)
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Pruebas de promedio.
Combinaciones Bloques
de tratamientos I II III
attach(datos)
datos
DAF=aov(rendimiento~bloques+N*P+N*K+P*K+N*P*K)
summary(DAF)
cv=cv.model(DAF)
summary (lm(rendimiento~bloques+N*P+N*K+P*K+N*P*K))
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
a iii 33.13833
a i 32.53583
a ii 32.38917
LSD.test(rendimiento,N:P:K,22,5.198)
a iii:ii:ii 35.45667
a iii:i:ii 34.85667
a ii:i:ii 34.50667
ab ii:ii:ii 34.32667
bc ii:ii:i 30.55
c iii:ii:i 30.23667
c ii:i:i 30.17333
Para estudiar el rendimiento de 2 cultivares de ají dulce bajo un sistema de riego por goteo,
se utilizó un diseño de parcelas sub-sub-dividas en donde intervienen 3 factores. El primero
de ellos son los cultivares con 2 niveles (Perú 92 y Diamon). El segundo de ellos consiste
en las láminas de riego utilizadas, con 4 niveles (60, 70, 80 y 100 % Eto). Adjunto a esto,
se consideró la utilización del acolchado plástico negro como un tercer factor, con dos
niveles (Con acolchado plástico y Sin acolchado plástico). Los valores obtenidos en campo
se muestran en la tabla a continuación.
Estrategias de riego
Cobertura
BI BII BIII BI BII BIII BI BII BIII BI BII BIII
del suelo
Acolchado 4,77 7,59 5,51 3,89 4,65 4,42 8,20 7,96 9,07 6,36 7,01 8,14
S/Acolchado 4,59 3,01 4,03 4,33 5,34 6,05 5,06 3,48 5,67 8,64 4,39 6,48
Acolchado 1,80 2,42 3,54 2,92 2,96 3,77 5,05 3,26 4,48 4,38 3,91 4,54
S/Acolchado 3,17 2,56 2,65 2,74 2,56 3,53 3,19 2,61 3,55 2,95 2,78 5,10
Plaza (2011).
attach(datos12)
datos12
DAFPD=aov(rendimiento~cultivares+bloques+acolchado+acolchado*cultivares+
Error((bloques/(bloques*cultivares))/(acolchado/(acolchado*cultivares)))+
riego+cultivares*riego+acolchado*riego+cultivares*acolchado*riego)
summary(DAFPD)
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
duncan.test(rendimiento,cultivares,2,0.075)
Study:
for rendimiento
Critical Range
0.3398621
a peru.92 5.776667
b diamond 3.350833
duncan.test(rendimiento,riego,24, 0.6856)
Study:
for rendimiento
Critical Range
2 3 4
a 100.Eto 5.39
a 80.Eto 5.131667
b 70.Eto 3.93
b 60.Eto 3.803333
duncan.test(rendimiento,acolchado:riego,24, 0.6856)
Study:
for rendimiento
Critical Range
2 3 4 5 6 7 8
a acolchado:80.Eto 6.336667
ab acolchado:100.Eto 5.723333
bc s/acolchado:100.Eto 5.056667
cd acolchado:60.Eto 4.271667
cd s/acolchado:70.Eto 4.091667
d s/acolchado:80.Eto 3.926667
d acolchado:70.Eto 3.768333
d s/acolchado:60.Eto 3.335
duncan.test(rendimiento,cultivares:acolchado:riego,24, 0.6856)
Study:
for rendimiento
Critical Range
2 3 4 5 6 7 8
16
1.651846
a peru.92:acolchado:80.Eto 8.41
ab peru.92:acolchado:100.Eto 7.17
bc peru.92:s/acolchado:100.Eto 6.503333
h diamond:acolchado:60.Eto 2.586667