Sei sulla pagina 1di 39

AGRO 5005: BIOMETRA

LABORATORIOS

Laboratorio 1: Introduccin.................................................................................................2
Laboratorio 2: Manejo de datos Grficos I.......................................................................6
Laboratorio 3: Resumen grfico de datos II........................................................................9
Laboratorio 4: Estadsticos descriptivos...........................................................................11
Laboratorio 5: Probabilidad y Distribucin Binomial.......................................................14
Laboratorio 6: Distribucin Normal..................................................................................17
Laboratorio 7: Distribuciones Muestrales.........................................................................20
Laboratorio 8: Intervalos de Confianza y Pruebas de Hiptesis........................................22
Laboratorio 9: Pruebas t para una y dos muestras independientes....................................24
Laboratorio 10: Pruebas t para muestras pareadas............................................................27
Laboratorio 11: Anlisis de la Varianza.............................................................................30
Laboratorio 12: Tablas de Contingencia............................................................................32
Laboratorio 13: Regresin y correlacin lineal.................................................................34
Laboratorio 14: Diseo en bloques completos aleatorizados............................................36

1
Laboratorio 1: Introduccin

( x a )( x b ) x a b ( xy ) a x a y a
( x a ) / ( x b ) x a b ( x a )b x ab
n ! n(n 1)(n 2) L 1 0! 1
x1 x x0 1

(1) Simplifique y evale las siguientes expresiones:


2 5 -5 3
a. 10 x 10 = __________ f. 2 x 2 = __________
6 5 2 2
b. (10 )/(10 ) = ________ g. 4 /2 = ___________
3 2 2
c. 2 x 3 = __________ h. (5 x 3) = __________
3 3 2 2
d. (3 ) = ____________ i. (0.01 )/(0.001 ) = ________
e. 7! = _______________ j. (6!)/(3!) = __________

(2) Notacin sumatoria. Escriba los sumandos de cada una de las sumas siguientes:
4
Ejemplo: X
i 1
i X1 X 2 X 3 X 4
4
a. ( X i a )
i 1

6
b. XY
i 1
i i

c. X j 1
j

4
d. a X i
i 1

(3) Para la muestra de tamao n=5 presentada abajo, evale las siguientes sumatorias.
Use las funciones en su calculadora que le permitan simplificar los clculos.
X 1 119, X 2 98, X 3 79, X 4 89, X 5 95

5
a. X
i 1
i

2
5
b. X
i 1
i /5

5
c. (X
i 1
i 96)

5
d. (X
i 1
i 96) 2

5
e. X
i 1
i
2
( X i ) 2 / 5

(4) Identifique las posiciones en la matriz y evale las sumatorias. Recuerde que el
primer subndice indica la fila, y el segundo la columna. (Ejemplo: en la fila 2 y columna
3, el valor numrico 5 puede ser identificado como X 2,3 )

1 3 2 3

5 7 5 6
2 3 3 4

1 2 1 2

4
a. X
i 1
i ,2

b. X
j 1
4, j

c. X
j 1
2
1, j

4,4

d.
i 1, j 1
X i, j

4
e. X
i 1
i ,i

3
(5) Cierto tipo de desperdicios contaminantes (como excrementos de ganado lechero)
puede traer problemas serios de contaminacin por nitratos a los acuferos. Para
estudiar este problema se escogieron 80 muestras aleatorias de agua en los acuferos
del rea norte de Puerto Rico.

a. Identifique la poblacin de inters.


b. Identifique la muestra.
c. Qu caractersticas de la poblacin le interesara medir para estudiar el
problema?
d. Cmo resumira la informacin obtenida en la muestra?

(6) Se desea estudiar la capacidad respiratoria (VO 2MAX) de estudiantes universitarios.


Para ello se escogen 100 estudiantes al azar en el RUM y a cada uno se le medir la
capacidad respiratoria. Adems se registrar el sexo, la edad, el nivel de actividad
fsica, y otras caractersticas.

a. Identifique la poblacin de inters.


b. Identifique la muestra.
c. Cmo podramos seleccionar esta muestra?
d. Qu preguntas de investigacin podran formularse con la informacin
disponible en los estudiantes estudiados en la muestra?

Infostat es un programa en espaol que permite realizar la mayora de los clculos


estadsticos, tiene capacidades grficas bastante avanzadas y un manejo de datos similar a
otros programas de bases de datos. La mayora de los clculos de resumen y de los
grficos tambin pueden realizarse en Excel, pero los anlisis estadsticos normalmente
no se pueden hacer en Excel sin programas adicionales.

En este ejemplo vamos a entrar datos que trabajaremos en los prximos laboratorios.
Representan una muestra aleatoria simple de 40 rboles de caf. Los datos representan
presencia de roya (una enfermedad), altura (m) y dimetro (cm) de cada rbol.

4
rbol Enfermo Altura Dimetro
1 no 3.17 11
2 si 3.27 9
3 no 2.60 10
4 no 2.24 18
5 no 3.58 6
6 no 2.89 14
7 si 3.00 11
8 no 3.74 9
9 no 2.83 11
10 no 2.13 8
11 si 2.83 6
12 no 4.23 10
13 no 3.24 12
14 no 3.22 8
15 no 2.23 8
16 no 2.62 12
17 no 3.31 11
18 no 2.95 5
19 si 2.48 8
20 no 2.59 7
21 no 2.61 13
22 no 2.71 2
23 no 2.61 5
24 no 4.96 9
25 no 2.05 14
26 no 3.97 15
27 no 2.73 13
28 no 3.09 10
29 no 3.48 12
30 si 2.57 8
31 si 3.17 5
32 no 2.34 10
33 si 3.23 7
34 si 3.62 11
35 no 3.55 5
36 no 2.67 6
37 si 3.41 10
38 no 2.43 14
39 no 0.96 10
40 si 2.67 5

(7) Usando el men datos, frmulas, transformar los datos de altura (m) a altura (pies)
y colocarlos en una nueva columna. (1m=3.28ft)
(8) Usando el men datos, acciones sobre las columnas, categorizar, por intervalos,
personalizado, crear las siguientes 4 categoras de dimetro: hasta 5cm, ms de 5cm
hasta 9cm, ms de 9cm hasta 12cm, ms de 12cm.
(9) Usando el men datos, ordenar, contar cuntos rboles estn enfermos.

5
Laboratorio 2: Manejo de datos Grficos I
Planes de muestreo

Para cada uno de los siguientes planes de muestreo, identifique el nombre del plan de
muestreo que se est usando e indique cul es la unidad (o unidades) de muestreo.

1. Se desea estimar el dao por roya (una enfermedad) de caf en una finca. Para ello se
lleva a cabo el siguiente plan de muestreo: Caminando a lo largo de la primera hilera
en la finca, se elige aleatoriamente un rbol entre los primeros 20 rboles. Luego de
realizar esta evaluacin se contina caminando y se evala cada rbol ubicado en la
posicin nmero 20 (es decir, se cuentan los rboles a partir del que se ha evaluado y
se evala cada 20 rboles). Como hay aproximadamente 600 rboles en la finca, se
espera muestrear alrededor de 30 rboles. A cada rbol se le realiza una evaluacin
visual del dao por roya en las hojas (escala 1 a 5, con 1 representando sin dao y
5 representando mayora de hojas completamente daadas).

2. Para estudiar la prevalencia de mastitis (definida aproximadamente como el


porcentaje de animales enfermos) en hatos lecheros en Puerto Rico se eligen 15
vaqueras aleatoriamente de la lista de vaqueras registradas en el Departamento de
Agricultura. En cada vaquera se examinan 12 vacas aleatoriamente elegidas.

3. En un estudio de capacidad de secuestro de carbono por bosques secundarios, se va


a determinar la altura y el dimetro de todos los rboles en parcelas escogidas
aleatoriamente del rea central de Puerto Rico. En cada una de las tres zonas
ecolgicas identificadas en mapas se elegirn al azar parcelas de 0.5 hectreas, y se
registrarn las variables de inters en todos los rboles de la parcela. La cantidad de
parcelas a elegir en cada zona ecolgica es proporcional al rea que esa zona
representa respecto al rea total de la zona central de Puerto Rico.

Manejo de datos en Infostat

Para manejar datos en Infostat se puede trabajar con el men Datos. Este men permite
crear nuevas filas, insertar o eliminar filas, activar/desactivar casos (filas),
crear/insertar/eliminar columnas, poner etiquetas (nombres a las columnas), definir el
tipo de datos en una columna, la cantidad de decimales a mostrar, ordenar, crear
categoras, transformar y aplicar frmulas. En este laboratorio vamos a trabajar con los
datos de caf entrados en la ltima clase y con otros conjuntos de datos que ya estn en
Infostat. Los archivos de Infostat se acceden con el men Datos, abrir datos de prueba.

6
Descripcin de algunos de los conjuntos de datos

Atriplex: representa los datos de porcentaje de germinacin, peso seco, plntulas


normales, tamao y color de semillas, se cuenta con 27 registros (Fuente: Software
InfoStat)
Hembras: se muestran medidas (dimetro del cuerpo, longitud de cola, longitud del
cuerpo, etc.) tomadas en hembras de una especie de nematodo que creci a distintas
temperaturas (Fuente: Software InfoStat)
Ajo Blanco: se muestran 1600 datos de permetro y el peso de la cabeza de 1600 ajos
de las cosechas de 1998 y 1999 (Fuente: Software InfoStat)
Capacidad Respiratoria: Se muestran datos de un estudio realizado por una
compaa farmacutica para examinar los efectos de tres drogas sobre la capacidad
respiratoria de pacientes de asma (Fuente: Software InfoStat)

Para usar el men de grficos debemos tener la tabla de datos abierta. Hay dos ventanas
relacionadas: Herramientas grficas y Grficos. Vamos a preparar distintos grficos con
los datos provistos y aprenderemos las herramientas bsicas sobre los ejemplos. Es muy
importante que practiquen distintas alternativas, opciones, etc. hasta lograr el grfico
deseado. Una vez que est el grfico completo podemos hacer copia del mismo para
ponerlo, por ejemplo, en Word o PowerPoint. En el manual de Infostat (men
Ayuda>Manual) se describen todas las opciones grficas disponibles.

Es importante recordar que Infostat solamente guarda los cambios efectuadas en la tabla
de datos abierta, es decir, no guarda ni grficos ni la salida mostrada en la ventana
Resultados. Si queremos guardar los grficos tenemos dos opciones: o los copiamos en
un documento (por ejemplo en Word), o los guardamos como grficos de Infostat. La
ltima opcin nos permitir cambiarlos en el futuro, mientras que si queremos cambiar un
grfico que ya est pegado en Word debemos rehacerlo en Infostat.

4. Realice un grfico de barras para ver la altura promedio de rboles sanos y enfermos
(datos de caf usados en el laboratorio 1). Use como variable a graficar la altura, y
como criterio de clasificacin la variable enfermo. Las opciones que puede usar son
media, ninguna medida de variabilidad. Una vez obtenida arregle las escalas, los
ejes, etc. de manera que se pueda apreciar bien lo que se quiere mostrar.

5. Grafique los siguientes datos, referidos a la distribucin porcentual del gasto de


alimento en distintas categoras.
Categora %
Productos lcteos 13.4
Cereal y panificados 12.6
Bebidas sin alcohol 8.9
Pescados y aves 7.5
Frutas y vegetales 15.6
Carne 24.5

7
Otras 17.5

8
6. Grafique los siguientes datos, que representan los gastos de familias urbanas y rurales
en distintos rubros, mediante un grfico apropiado (Ayuda: dos grficos de sectores, o
uno de barras adyacentes podran usarse):

Familia alimentacin serv. e imp. educacin otros


Urbana 300 90 120 100
Rural 500 50 50 100

7. Prepare el siguiente grfico, presentado en las notas de clase (pgina 9) a partir de los
datos de Atriplex (porcentaje de germinacin vs. tamao, en barras adyacentes por
color):

100
% G e rm in a ci n

75

50

25

0
chicas medianas grandes
Tamao

PG-claro PG-oscuro
PG-rojizo

8. Elabore un grfico de puntos con los datos de hembras donde aparezca en el eje X
la variable temperatura y en el eje Y la variable longitud de cuerpo.
9. Prepare un diagrama de dispersin para los datos de ajo blanco, ya que deseamos
estudiar la relacin entre el peso (Y) y el permetro (X). Haga un grfico con ambos
aos juntos y otro grfico que identifique el ao con colores diferentes. Hay
diferencias entre aos?
10. Prepare un grfico de barras para el conjunto de datos capacidad respiratoria, de
manera que pueda comparar cmo cambia con el tiempo la capacidad respiratoria
promedio bajo los distintas drogas (Ayuda: particiones por droga, y ubique las
particiones en el mismo grfico).

9
Laboratorio 3: Resumen grfico de datos II

1. Usando los datos de caf, construya una tabla de frecuencias para la variable altura
(en metros) usando InfoStat (men Estadsticas>Tablas de Frecuencias). Escoja
nmero de clases personalizado, con valor mnimo de .905, mximo de 5.105 y 7
clases (verificar que esto les da un ancho de clase de 0.6, como deseamos). Ahora
prepare un histograma de frecuencias absolutas a mano (usando la tabla de
frecuencias como base) y en Infostat (men Grficos>Histograma, use las mismas
clases que us para la tabla de frecuencias: comience con 0.905m (como extremo
inferior de la primera clase) y use un ancho de clase de 0.6 m.
Tanto para tablas de frecuencias como para histogramas, en InfoStat se puede indicar
qu tipo de tabla/grfica se desea (lmites de clase, marca de clase, frecuencia
absoluta, frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa
acumulada).

2. Usando los datos del archivo salinidad, construya un histograma y una ojiva para
biomasa. Usando la ojiva, qu porcentaje de las observaciones tienen biomasa menor
de 1000?, y mayor de 2000?

3. Usando los datos del archivo salinidad, construya un diagrama de tallo y hoja para
pH. (Ordene los datos previamente con Infostat para simplificar la construccin).
Construya un histograma con los mismos datos. Compare el histograma con el
diagrama de tallo y hoja.

4. Use los datos de ajo blanco. Construya un histograma de frecuencias relativas y un


polgono de frecuencias acumuladas para la variable permetro. Aproximadamente,
qu porcentaje de las observaciones tienen permetros mayores de 20?

5. Usando los datos de capacidad respiratoria base, realice grficas que le permitan
comparar las capacidades respiratorias bases de los pacientes sometidos a las tres
drogas diferentes.

6. En las siguientes grficas, indique el nombre de cada grfica, mencione cules


grficas estn correctas y cules podran inducir a interpretaciones errneas o falaces.
Justifique brevemente.

10
11
Laboratorio 4: Estadsticos descriptivos
Calcule los estadsticos indicados utilizando los datos de caf. Realice los clculos usando
Infostat y calculadora. Utilice las reglas de redondeo discutidas.

Dimetro (en cm) de rboles enfermos:

n n

Yi ______
i 1
Y
i 1
i
2
_____ Y _____ n _____

s 2 _____ s _____ C.V . _____


Md _____ Q1 _____ Q 3 _____ IQR=_____

Altura (en m) de rboles (todos juntos):

n n

Yi ______
i 1
Y
i 1
i
2
_____ Y _____ n _____

s 2 _____ s _____ C.V . _____


Md _____ Q1 _____ Q 3 _____ IQR=_____

2. Determine el porcentaje de rboles cuyas alturas estn dentro de los intervalos siguientes:

(a) Y s : _____
(b) Y 2s : _____
(c) Y 3s : _____
(d) Estn de acuerdo estos porcentajes con aquellos que se esperaran en una
distribucin normal? Justifique su respuesta.

3. La edad media de 5 personas en una habitacin es de 30 aos. Una persona de 36 aos entra a
la habitacin. Cul es ahora la edad media de las 6 personas?

4. Considere los datos de Hembras de nemtodos. Nos interesa estudiar si la longitud de la cola
(lcola) depende de la temperatura. Calcule estadsticos descriptivos que le permitan estudiar esta
relacin. Indique sus conclusiones.

5. Usando los datos de capacidad respiratoria base, realice grficas de caja que le
permitan comparar las capacidades respiratorias bases de los pacientes sometidos a las
tres drogas diferentes.

12
6. El siguiente grfico representa los datos de biomasa estudiados en el laboratorio 3. Usando esta
grfica indique los valores aproximados de la mediana, los cuartiles y el recorrido intercuartlico.
Calcule los mismos estadsticos usando Infostat y compare los resultados.
Polgono de frecuencias acumuladas

1.00
0.95
0.90
0.85
0.80
0.75
0.70
frec. rel. acumulada

0.65
0.60
0.55
0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400
300 500 700 900 1100 1300 1500 1700 1900 2100 2300 2500

Biomasa

7. Grficos de caja. Considere los datos de ajo blanco.


a. Calcule la media, mediana y cuartiles de los datos de peso y permetro
clasificados por ao.
b. Construya grficos de caja para peso (clasificado por ao)
c. Construya grficos de caja para permetro (clasificado por ao).
d. Cul de las distribuciones de datos es ms simtrica: las de pesos o las de
permetros? Justifique su respuesta usando tanto los resultados de la parte (a)
como los grficos.

13
REGLAS DE REDONDEO

Utilice un dgito decimal adicional a la cantidad de decimales presentados en las


observaciones originales.
Redondee su respuesta final, y no los clculos intermedios (por ejemplo, no use una
varianza redondeada para calcular la desviacin estndar).
Cuando un 5 (exactamente un 5) tiene que ser redondeado: redondee hacia arriba cuando
el dgito previo es impar, y redondee hacia abajo si el dgito previo es par.

Ejemplo 1 (datos originales son enteros).

Valor calculado Valor redondeado


58.4500 58.4
58.3500 58.4
58.4506 58.5
58.3512 58.4
58.4219 58.4
58.4780 58.5
58.9981 59.0
58.0136 58.0

Ejemplo 2 (datos originales tienen un


decimal)

Valor calculado Valor redondeado


1.5650 1.56
1.5550 1.56
1.2135 1.21
1.3765 1.38
1.7051 1.71
1.9921 1.99
1.9962 2.00
1.0028 1.00

14
Laboratorio 5: Probabilidad y Distribucin
Binomial
1. Para el experimento aleatorio de arrojar 3 monedas diferentes (una de $0.05, una
de $0.10 y una de $0.25), realice una lista con los 8 resultados igualmente
probables.
a. Calcule P(A=observar menos de 2 caras).
b. Calcule P(B=observar 1 o ms caras).
c. Calcule P(C=exactamente 3 caras).
d. Son A y B mutuamente excluyentes?
e. Son A y C mutuamente excluyentes?
f. Son B y C mutuamente excluyentes?
g. Calcule P ( A B ), P ( A C ), P (C ).

2. Considere nuevamente el experimento de arrojar tres monedas diferentes, y defina


la variable aleatoria Y = cantidad de caras que se obtienen.
a. Es sta una variable aleatoria discreta o continua?
b. Realice una lista de los posibles valores de Y, y calcule las probabilidades de
cada uno de ellos.
c. Grafique la distribucin de probabilidad calculada en la parte (b).

3. La tabla siguiente representa los resultados de un estudio para comparar un


tratamiento nuevo para prevenir el resfro comn. Trescientos pacientes fueron
tratados, mientras que 200 pacientes comparables no se trataron. Los resultados
indican la cantidad de pacientes que no tuvieron ningn resfro, un resfro o ms
de un resfro durante la temporada invernal.
Pacientes Resfros Total
No Uno Ms de uno
Tratados 145 80 75 300
No tratados 80 70 50 200

Si un paciente se escoge al azar de entre los 500 pacientes del estudio,


a. cul es la probabilidad de que haya sido tratado y no haya tenido resfros?
b. cul es la probabilidad de que no haya sido tratado y haya tenido uno o ms
resfros?

Si un paciente se escoge al azar de entre los 300 pacientes tratados,


c. cul es la probabilidad de que no haya tenido resfros?
d. cul es la probabilidad de que haya tenido ms de un resfro?

Si un paciente se escoge al azar de entre los 200 pacientes no tratados,


e. cul es la probabilidad de que no haya tenido resfros?
f. cul es la probabilidad de que haya tenido ms de un resfro?
g. Comparando sus respuestas a las preguntas (c) y (e), podra afirmar que el
tratamiento parece efectivo?
4. En estudios ecolgicos nos interesa estudiar cmo dos especies de rboles se
mezclan o se separan en un bosque. Supongamos que estamos estudiando dos
especies, A y B. Un mtodo para medir su asociacin es muestrear aleatoriamente
un rbol, ver de qu especie es, y entonces observar la especie del rbol vecino
ms cercano. Este proceso se repite para muchos rboles. Se muestran los datos
obtenidos para dos bosques.

Vecino ms cercano
Bosque I A B Total
muestreadorbol
A 30 10 40
B 5 55 60

Total 35 65 100

Vecino ms
cercano
Bosque II A B Total
muestreado

A 5 35 40
rbol

B 30 30 60

Total 35 65 100

a. Para un rbol elegido al azar en el bosque I, encuentre la probabilidad que,


1. Sea de la especie A.
2. Tenga un vecino de la especie A, dado que se observ que el rbol
muestreado era de la especie A.
3. Tanto el rbol muestreado como su vecino sean de la especie A.
4. Tanto el rbol muestreado como su vecino sean de la misma especie.
b. Responda las preguntas anteriores para un rbol elegido al azar en el bosque II.
c. Qu probabilidad podra usarse como medida de asociacin entre especies?
d. Cul de los bosques parece tener mayor separacin de las especies? Porqu?
Distribucin binomial. Para calcular probabilidades de la distribucin binomial (y otras)
en Infostat se puede usar el men Estadsticas > Probabilidades y cuantiles.

5. Suponga que solamente el 30% de los estudiantes en una escuela se ejercitan lo


suficiente. Si se obtiene una muestra aleatoria de 10 estudiantes de esa escuela,
a. cul es la probabilidad que ninguno de los estudiantes en la muestra se
ejerciten lo suficiente?
b. Cul es la probabilidad que 3 o menos de los estudiantes en la muestra se
ejerciten lo suficiente?

6. Los entomlogos estn a menudo interesados en estudiar el efecto de atrayentes


qumicos (feromonas) sobre los insectos. Una tcnica comn es liberar varios
insectos a una distancia igual de la feromona bajo estudio y de una sustancia sin
efecto (control). Si la feromona tiene efecto, ms insectos se dirigirn hacia ella
en vez de dirigirse hacia el control. Si no hay ningn efecto, un insecto se dirigir
hacia una de las dos posibilidades con igual probabilidad (es decir, la probabilidad
que el insecto se dirija hacia la feromona es 0.5). En un experimento 5 insectos se
liberan. Calcule las siguientes probabilidades suponiendo que la feromona no
tiene ningn efecto.
a. P(los cinco insectos se dirijan hacia la feromona)
b. P(exactamente cuatro insectos se dirijan hacia la feromona)
c. P(al menos 1 insecto se dirija hacia la feromona)

7. Una profesora de biometra va a dar un quiz con 10 preguntas cierto-falso.


Supongamos que un estudiante adivina cada respuesta independientemente (es
decir, no tiene idea del tema).
a. Cul es la probabilidad que el estudiante acierte las 10 preguntas?
b. Cul es la probabilidad que el estudiante acierte al menos 8 preguntas?
c. Cul es la probabilidad que el estudiante acierte no ms de 6 preguntas?
d. Si la profesora decide que aprobarn el quiz todos los estudiantes que
contesten correctamente por lo menos 6 de las 10 preguntas, qu porcentaje
de los estudiantes que adivinan cada respuesta pasarn el quiz?

8. Se conoce que slo el 35% de las semillas de una planta en peligro de extincin
son capaces de germinar bajo condiciones de invernadero. Se sembrarn 20
semillas.

a. Cul es la probabilidad que germinen al menos la mitad de ellas?


b. Cul es la probabilidad que germinen 5 o menos semillas?
c. Si observamos que ninguna de las semillas ha germinado, es razonable
pensar que el porcentaje de germinacin en la poblacin es del 35%?
Explique.
Laboratorio 6: Distribucin Normal
La tabla 1 del texto presenta la probabilidad de que un valor aleatorio de Z = (Y-)/ sea menor
que el valor tabulado z (rea bajo la curva entre menos infinito y z). Para realizar lo mismo en
InfoStat se puede usar el men Estadsticas > Probabilidades y Cuantiles. Recuerde
redondear probabilidades a cuatro lugares decimales.

1. Use la tabla e Infostat para determinar las probabilidades siguientes:


a. P(Z<-2)=
b. P(Z>2.56)=
c. P(Z<-1.23)=
d. P(Z<2.25)=
e. P(-1.63<Z<2.57)=
f. P(-1.70<Z<-0.25)=
g. P(1.42<Z<1.89)=

2. Encuentre el valor de a tal que la probabilidad sea la especificada. Incluya un diagrama


en cada caso. Use la tabla e Infostat.
a. P(Z<a)=.84
b. P(Z>a)=.19
c. P(Z<a)=.23
d. P(Z>a)=.65
e. P(-a<Z<a)=.90

3. Otra alternativa en Infostat es usar el men Aplicaciones > Didcticas > Grficos
de funciones de densidad continuas. Aqu no slo obtenemos las probabilidades
sino tambin las grficas. Para superponer varias grficas es posible usar la opcin clonar
(herramientas grficas). Se obtendr una copia (clon) de la serie grfica original. Si
seleccionamos esta nueva serie podemos cambiar sus parmetros y comparar ambas
distribuciones. Grafique en un mismo grfico las funciones correspondientes a tres
distribuciones normales:
10, 2 1 , 10, 2 3 , 9, 2 3 .

4. Usando la definicin de cuartiles (valores de la variable que dejan un 25% o un 75% de la


distribucin a la izquierda), calcule los valores de Q1 y Q3 en la distribucin normal
estandarizada. Cul es el valor de RIC (recorrido intercuartlico)? Use la tabla e Infostat.
Para encontrar probabilidades asociadas con una distribucin normal general se debe transformar
el valor de Y en Z y usar la tabla. Ejemplo: Dado Y ~ N ( , 2 ) , calcular P(Y<115): P(Y<115) =
P(Z<(115-100)/6) = P(Z<2.50) = 0.9938. El problema inverso (encontrar un valor de Y que
acumule cierta probabilidad) se resuelve calculando primero el valor de Z y despus resolviendo
y
la ecuacin z . Ejemplo: Encontrar a tal que P(Y<a)=0.6591. A partir de las tablas de Z,

P(Z<.41)=.6591. Entonces .41=(a-100)/6, por lo que a=102.46. No olvide que para encontrar el
valor de a primero tenemos que expresar la probabilidad como P(Y<a), es decir no podemos ir a
la tabla directamente con P(Y>a).

5. Para Y ~ N ( 100, 36) , calcule las siguientes probabilidades. Incluya un


2

diagrama en cada caso. Use tablas e InfoStat.


a. P(93<Y<102)=
b. P(90<Y<95)=
c. P(Y>103)=
d. P(Y<98)=

6. Para la misma situacin Y ~ N ( 100, 36) , calcular los valores de a. Incluya un


2

diagrama en cada caso. Use tablas e InfoStat.


a. P(Y>a)= .25
b. P(Y<a)= .08
c. P(Y>a)= .72
d. P(Y<a)= .995

7. Un programa de seleccin en maz trata de obtener plantas no demasiado altas. Suponga


que la altura de las plantas sigue una distribucin normal con media 160 cm y desviacin
estndar 21 cm.
a. Qu proporcin de las plantas van a ser eliminadas si se decide descartar todas
las plantas cuya altura exceda 180 cm?
b. A partir de qu altura se deberan descartar las plantas si se desea eliminar un
20% del lote?

8. La cantidad de oxgeno disuelta en el agua de ros depende de la temperatura, la cantidad


de materia orgnica en descomposicin, de la presencia de contaminantes, etc. El Council
of Environmental Quality (CEQ) considera que un contenido de oxgeno disuelto menor
de 5 mg/l es indeseable porque no sera capaz de sustentar la vida acutica. Suponga que
una planta industrial descarga sus residuos en el ro y las mediciones de oxgeno disuelto
corriente abajo de la descarga tienen una distribucin normal con media de 6.5 mg/l y
desviacin estndar de 0.6 mg/l.
a. Qu proporcin de los das ser el contenido de oxgeno disuelto considerado
indeseable por el CEQ?
b. Hasta qu valor podra caer el contenido de oxgeno disuelto? (ayuda: entre
qu valores de la variable Ud. espera encontrar virtualmente todas las
observaciones?)
9. La longitud del caparazn del langostino Thenus orientalis, encontrado comnmente en
los mercados de Singapur, tiene una distribucin aproximadamente normal, con una
media de 59.5 mm y una desviacin estndar de 4.6 mm.
a. Si va a seleccionar aleatoriamente un langostino de esta poblacin, qu probabilidad
tiene de que ste tenga una longitud menor de 55mm?
b. Si el gobierno decretara que todos los langostinos que se vendan en el mercado deben
tener una longitud mnima de 50mm, qu proporcin de los langostinos sern de un
tamao ilegal para la venta?
c. Un comerciante tiene una anuncio que dice Nosotros garantizamos que los todos los
langostinos que vendemos en este negocio son los ms grandes disponibles. Qu
longitud mnima deberan tener para asegurarnos que esto langostinos estn en el 10%
superior de la poblacin?
Laboratorio 7: Distribuciones Muestrales
La siguiente es una poblacin (artificial) con 10 individuos (elementos). Tenemos aqu
los valores de cada elemento (supongamos, p.ej., que son dimetros de rboles). Los
parmetros de esta poblacin son 2.5, 2 1.45.
Poblacin original

4
frecuencia absoluta

0
1 1 2 3 4 5 6
Columna4

1. Generar en Infostat todas las muestras posibles de tamao n=2 y n=5 (se puede usar el
men Aplicaciones>Didcticas>Todas las muestras posibles). Calcular la media de cada
muestra y guardar estas medias en dos columnas de datos (usar copiar/pegar). Graficar la
distribucin muestral de la media para ambos tamaos usando la misma escala horizontal.

a. Cul de las dos distribuciones tiene menos variabilidad?


b. Cmo se comparan las medias de ambas distribuciones?
c. Son suficientemente grandes los tamaos de estas muestras como para que las
distribuciones parezcan normales?

2. El archivo zanahoria.idb contiene los pesos de 144 zanahorias (en g).


a. Calcule la media y la varianza de la poblacin.
b. Prepare un histograma de frecuencias relativas con las observaciones en esta
poblacin (use para el eje horizontal un valor mnimo de 0 y un mximo de 1200).

3. Para verificar las propiedades de la distribucin muestral de la media, vamos a tomar


muestras con reemplazo de la poblacin de zanahorias descripta en la parte2. Use el
men Aplicaciones>Didcticas>Muestreo-Remuestreo.
a. Escoja 1000 muestras con reposicin de tamao n=4 y use la opcin de guardar la
media muestral.
b. Calcule la media y la varianza poblacionales de la poblacin de 1000 medias de
tamao n=4.
c. Prepare un histograma de frecuencias relativas de la poblacin de 1000 medias de
tamao 4. (Use para el eje horizontal un valor mnimo de 0 y un mximo de
1200.)
d. Repita las partes a, b y c para tamao de muestra n=16.
e. Comparar las medidas de resumen de la poblacin original, de la poblacin de
medias de n=4, y de la poblacin de medias de n=16.
f. Comparar los histogramas de la poblacin original, de la poblacin de medias de
n=4, y de la poblacin de medias de n=16.

4. La distribucin del porcentaje de grasa lctea en ganado Holstein durante la dcada de


1970 era aproximadamente normal con una media de 3.4 y una desviacin estndar de
0.3.
(a) Qu porcentaje de las vacas producan leche con menos de 3 de grasa?
(b) Qu porcentaje de las vacas producan leche con ms de 4 de grasa?
(c) Calcule el percentil 95 de la distribucin de grasa lctea. Interprete este valor.

5. Supongamos que una muestra aleatoria de n 25 vacas Holstein se selecciona de la


poblacin mencionada en el problema 4. A cada vaca se le mide el porcentaje de grasa en
su leche, y se calcula la media muestral.
(a) Cmo sera la distribucin de los valores posibles de Y ?
(b) Compare la forma de la distribucin de Y con la forma de la distribucin de Y (el
porcentaje de grasa lctea en cada vaca).
(c) Calcule la probabilidad que una muestra aleatoria de tamao 25 tenga una media muestral
menor de 3. Compare este resultado con el de 4.
Laboratorio 8: Intervalos de Confianza y Pruebas
de Hiptesis
1. Usando Infostat, genere 100 intervalos de confianza del 90% y calcule el porcentaje que
no cubren a la media verdadera (use el men Aplicaciones>Didcticas>Intervalos de
confianza). Realice esto para datos de una distribucin normal con 20, 2 9 y
tamaos de muestra n=5, n=20, n=50.
a. Cambian significativamente los porcentajes de cobertura segn cambia el
tamao muestral?
b. Cmo se comparan los anchos de estos intervalos? Grafquelos en la misma
escala.

2. Determine el tamao de muestra si se sabe que 2=100 y que los L.C. del 95% son 17.2 y
22.8. Realcelo a mano y usando Infostat (Estadsticas>Clculo de tamao muestral>Para
estimar una media con una precisin dada).

3. Un bilogo desea estimar el efecto de un antibitico sobre el crecimiento de una bacteria.


Experiencias anteriores indican que la desviacin estndar del crecimiento (medido en
cm2) en placas de Petri con antibitico aadido es 13 cm 2. Determine el nmero de placas
que tiene que preparar para estimar el crecimiento promedio con un error de no ms de 3
cm2 (esto es, se desea que la media poblacional de crecimiento no est a una distancia
mayor que 3 de la media muestral). Use un nivel de confianza del 99%. Verifique sus
resultados con Infostat.

4. Se desea llevar a cabo un estudio sobre el peso promedio de chillos de tamao comercial
en el rea de La Parguera. Estudios previos realizados hace varios aos indican que la
varianza del peso de chillos es de 1.6 lb 2.Determine el tamao de muestra que se
requerira si se va a estimar el peso promedio con un error de 0.5 lb (y una confianza
del 95%). Verifique sus resultados con Infostat.

5. Para la situacin anterior, cmo se podra aproximar la varianza si no se tuviera


informacin previa?

6. Se desea probar que, luego de un tratamiento para un problema cardaco, los pacientes
pueden ejercitarse ms de 2 minutos. Se registr el incremento en la capacidad de realizar
ejercicios (en minutos) para 90 pacientes adultos. La media muestral fue de 2.2 minutos,
y la desviacin estndar de 1.05. Use estos datos para probar la hiptesis nula H 0: =2
versus Ha: >2. Use =.05 e indique sus conclusiones en trminos de este problema.

7. Calcule el nivel de significancia observado de la prueba realizada en la parte 6 (valor p)


y selo en vez de la regin de rechazo para probar las hiptesis. Presente un grfico en
Infostat (Aplicaciones >Didcticas> Grfico de funciones de densidad continuas)
8. Se sospecha que las vacas en Puerto Rico estn ms infestadas por garrapatas (Boophilus
microplus) que en el resto del Caribe (donde la infestacin promedio es 130
garrapatas/vaca). Una muestra aleatoria de 80 vacas en Puerto Rico present un promedio
de 134.1 garrapatas por vaca, con una varianza de 50.

a. Calcule el intervalo de confianza del 90% para , el promedio de garrapatas por vaca
en Puerto Rico.
b. Formule y pruebe las hiptesis de inters (=.05).
Laboratorio 9: Pruebas t para una y dos muestras
independientes
Pruebas de hiptesis para una media usando la distribucin t. Ejemplo resuelto en Infostat

Se ha realizado un estudio para determinar si cerdos alimentados con una dieta reformulada aumentan
ms de 20 lbs (en promedio) durante un periodo de alimentacin de un mes. Para ello se usaron 12 cerdos,
cuyos aumentos de peso se presentan a continuacin:
17, 22, 20, 19, 53, 21, 25, 40, 30, 19, 11, 16

Hiptesis H 0 : 20
H a : 20
Y 0 24.417 20
Estadstico de la prueba: t s
11.650
1.313
n 12
Regin de rechazo: t t0.05,11gl 1.796

Conclusiones: No se rechaza H0 .
1. Calcule las siguientes probabilidades usando la tabla t e InfoStat. Incluya un diagrama en
cada caso.
a. P(T>1.356) si gl=12
b. P(T<2.101) si gl=18
c. P(T<-1.319) si gl=23
d. P(T<-1.711) si gl=24
e. P(T<.697) si gl=11

2. Determine los valores crticos (valores en la tabla) de t, haga un diagrama de la


distribucin y lleve a cabo las pruebas indicadas. Calcule los valores p usando el
calculador de probabilidad de Infostat (o el graficador).

a. H 0 : 30, H a : 30, n 16, Y 32, s 2 25, 0.05


b. H 0 : 58, H a : 58, n 18, Y 57, s 2 100, 0.05
c. H 0 : 25, H a : 25, n 25, Y 9, s 2 20, 0.05
d. H 0 : 430, H a : 430, n 10, Y 400, s 2 14, 0.01

3. Los rendimientos de 7 plantas de pia aleatoriamente escogidas, variedad Cabezona, fueron


4.2, 5.6, 4.3, 4.8, 5.7, 5.5 y 4.9 kg/planta.
(a) Construya un intervalo de confianza del 95% para la media poblacional.
(b) Pruebe H0: =4.5, Ha: 4.5 usando =.05.
(c) Repita los pasos 1 y 2 usando InfoStat.

4. Se condujo un experimento para examinar la susceptibilidad de races de cierta variedad de


limonero a una larva especfica con el objetivo de probar si la cantidad de larvas en las races era
menor en esta variedad que lo que normalmente se encuentran en las variedades tradicionales.
Cuarenta y un plantas se expusieron a la larva, y se examinaron luego de cierto tiempo. La
respuesta de inters es el logaritmo del nmero de larvas por gramo encontradas en cada raz.
Para las 41 plantas estudiadas, la media muestral fue 9.02 y la desviacin estndar 1.12.
(a) Pruebe la hiptesis que =10 versus <10 usando =.01.
(b) Calcule el valor p usando InfoStat.
(c) Construya un intervalo de confianza del 95% para la susceptibilidad media de las
races.

5. En una compaa farmacutica se desea comparar la presin arterial sistlica de empleadas que
usan anticonceptivos orales que no usan anticonceptivos orales (todas entre 30 y 35 aos de
edad). Se obtuvieron dos muestras aleatorias: una de 8 empleadas que usan anticonceptivos orales
y otra de 21 empleadas que no usan anticonceptivos orales, y se les midi la presin arterial (mm
Hg). Los resultados fueron los siguientes:
Usan anticonceptivos orales: n=8, Y = 132.8 mm Hg, s=15.3 mm Hg
No usan anticonceptivos orales: n=21, Y = 127.4 mm Hg, s=18.2 mm Hg
(a) Conduzca una prueba para determinar si hay diferencias significativas entre las medias. Use
=.05.
(b) Pruebe si las empleadas que usan anticonceptivos orales tienen una presin arterial sistlica
mayor (en promedio) que las no los usan. Use =.05.

6. Un inspector de control de contaminacin sospechaba que una comunidad riberea estaba


descargando aguas servidas no-tratadas en el ro y eso cambiaba el nivel de oxgeno disuelto en el
ro. Para probar esto, obtuvo 5 muestras aleatorias de agua del ro en una zona ro arriba del
pueblo, y otras 5 muestras en una zona ro abajo del pueblo. Se midieron los niveles de oxgeno
disuelto, en ppm. Proveen los datos evidencia de un contenido menor de oxgeno ro abajo? Use
=.05.
Ro arriba: 4.8, 5.2, 5.0, 4.9, 5.1
Ro abajo: 5.0, 4.7, 4.9, 4.8, 4.9

7. Un estudio se realiz en 16 vacas lecheras. Ocho vacas fueron asignadas aleatoriamente a un


rgimen de lquidos de agua solamente (grupo 1), y las otras recibieron suero lquido solamente
(grupo 2). Adems, a cada animal se le dio 7.5 kg de grano por da, y se le permiti comer heno a
voluntad. Se registr, entre otras cosas, la cantidad de heno (en kg/vaca) consumido diariamente.

Grupo 1: 15.1, 14.9, 14.8, 14.2, 13.1, 12.8, 15.5, 15.9


Grupo 2: 6.8, 7.5, 8.6, 8.4, 8.9, 8.1, 9.2, 9.5
(a) Pruebe la hiptesis que hay diferencias entre los consumos diarios promedios de heno en los dos
grupos con =.01.
(b) Construya un intervalo de confianza del 99% para la verdadera diferencia entre la medias de
ambos grupos. El intervalo obtenido, contiene el valor 0? Qu relacin tiene esto con sus
conclusiones en la parte a?
(c) Cules son los supuestos necesarios para las pruebas realizadas en la parte a? Comente sobre su
validez en este caso (grafique los datos si fuese necesario).
Laboratorio 10: Pruebas t para muestras pareadas
PARTE I. Incluya en cada caso todos los pasos necesarios para probar las hiptesis correspondientes,
una grfica con ttab, clculo del valor p, conclusiones e interpretaciones. A menos que est especificado de
otra manera, use =.05.

1. Se desean comparar los rendimientos de dos nuevas variedades de maz. Debido a que existe una gran
variabilidad en los rendimientos en distintas fincas, se escogieron 7 fincas al azar, y se plant una
parcela con cada una de las variedades en cada finca. Los resultados del experimento son los
siguientes (en ton/ha):
Finca 1 2 3 4 5 6 7
Variedad A 4.82 4.46 4.97 4.05 5.46 4.71 5.14
Variedad B 4.15 4.01 4.40 4.12 4.98 4.17 4.68

(a) Pruebe la hiptesis de igualdad en los rendimientos de las dos variedades versus la alternativa a
dos colas. Use =.05.
(b) Construya un intervalo de confianza del 95% para 1-2, la verdadera diferencia entre los
rendimientos de las variedades A y B. . El intervalo obtenido, contiene el valor 0? Qu relacin
tiene esto con sus conclusiones en la parte a?

2. Los datos siguientes son logaritmos de recuentos de bacterias en siete botellas de leche (escogidas
aleatoriamente), tomados antes y despus de un tratamiento trmico. Se desea conocer si el
tratamiento reduce el nmero de bacterias. Formule y pruebe las hiptesis de inters usando =.05.
Botella Antes Despus
1 6.98 6.95
2 7.08 6.94
3 8.34 7.17
4 5.30 5.15
5 6.26 6.28
6 6.77 6.81
7 5.45 5.36
3. Se tomaron 11 hojas, una de cada una de 11 plantas de tabaco. Cada hoja se dividi en dos mitades.
Una de las mitades se eligi al azar y se trat con preparacin I y la otra mitad se trat con
preparacin II. El objetivo del experimento era comparar los efectos de las dos preparaciones del
virus del mosaico sobre el nmero de lesiones despus de un cierto perodo de tiempo. Los datos se
presentan en la siguiente tabla:
Planta Prep. I Prep. II
1 18 14
2 20 15
3 9 6
4 14 12
5 38 32
6 26 30
7 15 9
8 10 2
9 25 18
10 7 3
11 13 6
PARTE II: Trabajando en grupos de 2-3 estudiantes, decida cul de las pruebas t (para muestras
independientes o para datos pareados) usara Ud. en cada una de las siguientes situaciones.
Presente las hiptesis nula y alternativa. Justifique brevemente.

4. Una corporacin petrolera est interesada en realizar algunas pruebas preliminares para
comparar una nueva mezcla de gasolina con otra actualmente en el mercado. Diez
automviles idnticos se asignaron aleatoriamente, 5 a una gasolina y 5 a la otra gasolina.
Cada automvil se llen con 10 galones de gasolina y se condujo en una pista de pruebas
hasta que la gasolina se agot. El resultado fueron las millas recorridas en cada caso.

5. Una compaa tiene una poltica muy generosa (pero muy complicada) para ofrecer el bono
de navidad al personal gerencial de menor rango. El factor clave en la decisin es un juicio
subjetivo de la "contribucin a los objetivos de la corporacin". Un encargado de personal
tom muestras de 20 gerentes mujeres y 20 gerentes hombres para ver si haba diferencias
entre los bonos. Las observaciones se registraron como un porcentaje del salario anual.

6. En un estudio de los posibles factores que influyen en la frecuencia de pjaros embestidos


por aviones (que, irnicamente, se ve como un peligro para los aviones), el nivel de ruido de
varios aviones se midi dos segundos despus del despegue (momento en que las ruedas
dejan de tocar tierra). Veintids jets de cabina ancha y 10 jets de cabina angosta se midieron
y sus niveles de ruido se compararon.

7. Dos aleaciones se usan en la fabricacin de barras de acero. Se desea comparar la resistencia


de las barras hechas con cada aleacin. Se toman muestras aleatorias de 9 barras de la
aleacin A y de 15 barras de la aleacin B.

8. Con el objeto de estudiar el crecimiento de bacterias bajo dos dosis distintas de un cierto
bactericida, se prepararon 20 placas de Petri. En 10 de ellas se colocaron 200 ppm del
bactericida en el medio de cultivo, y en las otras 10, 1000 ppm. Luego de inocular las placas
con las bacterias, se colocaron en una cmara en forma completamente aleatoria, y al cabo de
cierto tiempo se midi el crecimiento radial de las bacterias.

9. Para estudiar el efecto de la exposicin de flores de alfalfa a diferentes condiciones


ambientales se escogieron 10 plantas vigorosas con flores expuestas libremente en la parte
alta, y flores escondidas en la parte basal. Se determin el nmero de semillas producidas por
10 vainas en cada ubicacin (parte superior y parte inferior).

10. Con el objeto de evaluar si una nueva formulacin permite obtener mayores aumentos de
peso, una muestra de 8 novillos es alimentada con la racin regular, y otra muestra de 8
novillos es alimentada con la racin reformulada. Se analizan los pesos de los novillos luego
de un ao.

11. Para estudiar el efecto de un tratamiento con fungicidas (usado para eliminar hongos) a
plantas de geranio, se registr la densidad de esporas del hongo Phytium sp. antes de aplicar
un tratamiento a 15 tiestos con plantas de geranio. A los 10 das de aplicar el tratamiento, los
mismos tiestos se evaluaron nuevamente y se registr la densidad de esporas del mismo
hongo.

12. Para estudiar el efecto de Motrin en pacientes con sndrome de tnel carpal se dise un
experimento durante el cual todos los participantes reciban el medicamento y un placebo.
Aproximadamente la mitad de los pacientes reciba Motrin durante 3 semanas, luego ninguna
medicacin durante 3 semanas y luego el placebo durante 3 semanas. El resto de los
pacientes reciba placebo durante 3 semanas, luego ninguna medicacin durante 3 semanas y
luego Motrin durante 3 semanas. Al final del primer y del tercer periodo de 3 semanas (es
decir, luego de tomar Motrin o el placebo), los participantes indicaban una puntuacin (score)
para el dolor, en relacin al dolor que sentan antes de comenzar el experimento.
Laboratorio 11: Anlisis de la Varianza
1. Se condujo un experimento para comparar el contenido de almidn en plantas de tomate bajo
distintos nutrientes (control, A o B). Doce plntulas se seleccionaron para el estudio,
asignndose cuatro a cada uno de los tratamientos aleatoriamente. Cada planta se coloc en
un tiesto con el nutriente correspondiente, y se ubicaron al azar en un invernadero. El
contenido de almidn en los tallos se determin 25 das despus (en g/mg).

Control 21 18 16 14
Nutriente A 12 14 15 10
Nutriente B 7 9 6 7

a. Formule y pruebe las hiptesis de inters usando =.05 (use InfoStat y verifique sus
resultados con las frmulas de trabajo presentadas en la conferencia).
b. Realice todas las comparaciones de a pares usando el mtodo de DMS de Fisher. Use
=.05 (use InfoStat y verifique sus resultados con las frmulas de trabajo presentadas en
la conferencia).
c. Construya un intervalo de confianza del 95% para la diferencia entre las medias del
nutriente A y el control.
d. Construya un intervalo de confianza del 99% para la media del nutriente B.

2. Se condujo un experimento para probar los efectos de 5 dietas diferentes en pavos. Seis
pavos se asignaron aleatoriamente a cada uno de los 5 dietas, y se alimentaron por un perodo
fijo de tiempo. Los resultados (libras de aumento de peso) se presentan a continuacin. Use
Infostat para resolver este ejercicio.

Grupo Aumento de peso (lbs)


Control 4.1, 3.3, 3.1, 4.2, 3.6, 4.4
Control+Dosis 1 del aditivo A 5.2, 4.8, 4.5, 6.8, 5.5, 6.2
Control+Dosis 2 del aditivo A 6.3, 6.5, 7.2, 7.4, 7.8, 6.7
Control+Dosis 1 del aditivo B 6.5, 6.8, 7.3, 7.5, 6.9, 7.0
Control+Dosis 2 del aditivo B 9.5, 9.6, 9.2, 9.1, 9.8, 9.1

a. Pruebe las hiptesis de inters usando =.05.


b. Realice todas las comparaciones de a pares (Prueba DMS de Fisher).
c. Grafique sus resultados.
3. Se est diseando un experimento para comparar 4 variedades de habichuela. Se usarn 6
parcelas con cada una de las variedades en un diseo completamente aleatorizado en un rea
experimental homognea rectangular de 8x3 parcelas. Prepare un mapa del rea experimental
con la asignacin de los distintos tratamientos (=variedades) a cada una de las parcelas.

4. Se probaron 5 mtodos para empacar y congelar yuca. De un grupo de 25 yucas homogneas


se escogieron 5 aleatoriamente y se procesaron con el mtodo I. Otras 5 se procesaron con el
mtodo II, y as sucesivamente. La respuesta de inters es el rendimiento (en % del peso
inicial obtenidos luego del proceso) obtenido al final del proceso.

Mtodo Rendimientos
I 60, 52, 56, 52, 65
II 64, 74, 66, 64, 67
III 55, 66, 68, 57, 55
IV 55, 56, 70, 59, 62
V 71, 65, 60, 69, 62

a. Existen diferencias significativas entre los rendimientos promedio de los diferentes


mtodos? Pruebe usando =.05.
b. Realice una prueba de DMS e indique claramente sus conclusiones.
c. Grafique sus resultados.

5. Se desea saber si existen diferencias entre tres grupos de pacientes asmticos en cuanto a su
reaccin al SO2 (cm H2O/s). Los grupos se definieron por su funcin pulmonar: grupo A,
FEV1/FVS<75%; grupo B, FEV1/FVS entre 75% y 85%; grupo C, FEV1/FVS>85%.

Grupo Reaccin bronquial al SO2


A 20.8, 4.1, 30.0, 24.7, 13.8
B 7.5, 7.5, 11.9, 4.5, 3.1, 8.0,
4.7, 28.1, 10.3, 10.0, 5.1, 2.2
C 9.2, 2.0, 2.5, 6.1, 7.5
a. Existen diferencias significativas entre las reacciones al SO2 en los diferentes grupos?
Pruebe usando =.05.
b. Realice una prueba de DMS e indique claramente sus conclusiones.
c. Grafique sus resultados.
Laboratorio 12: Tablas de Contingencia
1. Los siguientes datos provienen de un experimento para estudiar el efecto del tratamiento de
fro a plantas de azalea. Se escogieron plantas al azar de azalea, y se mantuvieron durante 30
das con el tratamiento correspondiente (fro / no fro). Luego de tratadas se contaron las
yemas abiertas y cerradas en cada grupo de plantas. Los datos se presentan a continuacin.

Tratamiento Yemas Yemas


abiertas cerradas
Fro 143 129
No Fro 116 214

a. Calcule las frecuencias esperadas en cada celda bajo el supuesto que la proporcin de
yemas abiertas es la misma en ambos tratamientos (esto es, si la proporcin de yemas
abiertas es independiente del tratamiento).
b. Calcule el estadstico 2 para probar la hiptesis de independencia. Indique sus
conclusiones usando =.05.
c. Grafique estos datos para apoyar sus conclusiones.

2. Los siguientes datos provienen de un estudio para comparar la opinin de agricultores


respecto a una nueva poltica de importacin de vegetales frescos. Se entrevistaron 230
agricultores y se clasificaron de acuerdo al tamao de la finca (grande, mediana, pequea) y a
la opinin (1, completamente de acuerdo; 2, parcialmente de acuerdo; 3, parcialmente en
desacuerdo y 4, completamente en desacuerdo).

Tamao | Opinin 1 2 3 4
Chico 1 19 30 50
Mediano 1 10 25 44
Grande 2 5 33 10

a. Calcule el estadstico 2 para probar la hiptesis de independencia entre el tamao de la


finca y la opinin respecto a la nueva poltica. Indique sus conclusiones usando =.05.
b. Grafique estos datos para apoyar sus conclusiones.
3. La siguiente tabla proviene de un estudio de factores que afectan la eleccin de alimento en
caimanes. Se usan datos de 219 caimanes capturados en cuatro lagos de Florida. La variable de
respuesta es el tipo de alimento primario (en volumen) encontrado en el estmago del caimn.
Esta respuesta tiene cinco categoras: (1) peces, (2) invertebrados, (3) reptiles, (4) aves y (5)
otros. La categora otros incluye anfibios, mamferos, material vegetal, piedras, o la no
existencia de un tipo dominante de alimento.

Alimento
Tamao Total
1 2 3 4 5
Hasta 2.3m 49 45 6 5 19 124
Ms de 2.3 m 45 16 13 8 13 95
Total 94 61 19 13 32 219

a. El tipo de alimento dominante encontrado en el estmago, depende del tamao del


animal? Formule y pruebe la hiptesis correspondiente usando =.01.
b. Grafique sus datos e indique sus conclusiones. Interprete claramente sus conclusiones en
trminos de las categoras de alimento encontradas en cada tamao de animal.

4. La tabla siguiente representa los resultados de un estudio para comparar un tratamiento


nuevo para prevenir el resfro comn. Trescientos pacientes fueron tratados, mientras que
200 pacientes comparables no se trataron. Los resultados indican la cantidad de pacientes
que no tuvieron ningn resfro, un resfro o ms de un resfro durante la temporada
invernal.

Pacientes Resfros Total


No Uno Ms de uno
Tratados 145 80 75 300
No tratados 80 70 50 200

a. Calcule el estadstico 2 para probar la hiptesis de que la cantidad de resfros no depende


del tratamiento. Indique sus conclusiones usando =.05.
b. Grafique estos datos para apoyar sus conclusiones.
Laboratorio 13: Regresin y correlacin lineal
1. Se condujo un experimento para examinar el efecto de diferentes concentraciones de pectina
sobre la firmeza de batata enlatada. Se usaron tres concentraciones (0%, 1.5% y 3% de pectina).
Se prepararon 6 latas con batatas en una solucin de 25% de azcar. Dos latas se asignaron
aleatoriamente a cada una de las concentraciones de pectina, agregndose la concentracin
correspondiente de pectina antes de enlatar. Las latas se sellaron y almacenaron a 25 C durante
30 das. Al cabo de este tiempo las latas se abrieron y se determin la firmeza del contenido de
cada lata. Los datos fueron los siguientes:

Pectina: 0% 1.5% 3%
Firmeza: 50.5, 46.8 62.3, 67.7 80.1, 79.2

a. Cul es la ecuacin lineal estimada? De acuerdo al grfico, sera razonable usar una lnea
recta para estos datos?
b. Formule y pruebe las hiptesis de inters usando =.05.
c. Es posible predecir la firmeza promedio que se obtendra usando 2% de pectina?, y usando
6% de pectina? Si su respuesta es afirmativa, obtenga el valor predicho. De lo contrario,
justifique.
d. Construya un intervalo de confianza del 90% para 0. Interprete este intervalo en trminos del
problema.

2. A efectos de estimar la productividad de un bosque, se desea estudiar la relacin entre el rea


basal de un rbol (x, en m2) y el volumen maderable del mismo (y, en m3). Se obtuvo una muestra
aleatoria de 12 rboles y para cada rbol se midi el rea basal y el volumen maderable luego de
cortado.

X .3 .5 .4 .9 .7 .2 .6 .5 .8 .4 .8 .6
Y 6 9 7 19 15 5 12 9 20 9 18 13

a. Indique e interprete el coeficiente de correlacin lineal.


b. Conduzca un anlisis de regresin lineal. Interprete (si fuese posible) los estimadores del
intercepto y de la pendiente en trminos de este problema. Formule y pruebe las hiptesis de
inters usando =.01. Indique sus conclusiones.

3. En el archivo de InfoStat reglin (que lo encontrar en Program Files>InfoStat>Datos) se


encuentran datos que estudian la relacin entre el pH del medio de cultivo y la biomasa producida
(en g).

a. Grafique los datos.


b. Estime la ecuacin de regresin.
c. Formule y pruebe las hiptesis apropiadas de regresin lineal.
d. Interprete, si fuese posible, los estimadores del intercepto y de la pendiente en trminos de
este problema.
e. Construya un intervalo de confianza del 99% para 1.

4. Generalmente se considera que las personas ms altas son mejores jugadores de baloncesto
porque son ms capaces de introducir la bola en la canasta. Los datos que aparecen en la tabla
basquetbol (en la pgina del curso) muestran las alturas de 25 atletas que no son jugadores de
baloncesto y el nmero de bolas que pudieron colocar en un periodo de 60 segundos.

a. Conduzca un anlisis de regresin lineal que permita corroborar o no esta afirmacin.


b. Interprete (si fuese posible) los estimadores del intercepto y de la pendiente en trminos de
este problema.
c. Formule y pruebe las hiptesis de inters usando =.01. Indique sus conclusiones.
d. Prediga, si es posible, la cantidad de bolas que colocara un jugador de 60 de altura y uno de
77 de altura.
Laboratorio 14: Diseo en bloques completos
aleatorizados
1. Se condujo un experimento para comparar los efectos de tres diferentes insecticidas en
habichuela. Se usaron cuatro bloques, cada uno con 3 hileras (= unidades experimentales)
a una distancia adecuada. Cada hilera se plant con 100 semillas y se mantuvo bajo uno
de los tratamientos con insecticida. Los insecticidas se asignaron aleatoriamente a las
hileras de forma tal que cada insecticida se aplic a una hilera de cada bloque. La
respuesta de inters fue el nmero de plntulas emergidas en cada hilera.

Insecticida Bloque 1 Bloque 2 Bloque 3 Bloque 4


A 56 49 65 60
B 84 78 94 93
C 80 72 83 85

a. Prepare una tabla de ANOVA en InfoStat.


b. Formule y pruebe las hiptesis de inters. Use =0.05. Indique sus conclusiones en
trminos de este problema.
c. Cmo se hubiese realizado la asignacin de los tratamientos a las unidades
experimentales si el diseo hubiese sido completamente aleatorizado? Describa
brevemente.
d. Realice, de ser necesario, una prueba de DMS para comparar los tratamientos. Use
=0.05. Indique sus conclusiones.
e. Grafique los resultados.
f. Construya un intervalo de confianza para la media del tratamiento A.
2. Se desea estudiar el efecto de cuatro nematicidas sobre el rendimiento de pltano. Para
ello se dispone de 16 parcelas que estn dispuestas en el campo de la siguiente manera:

Se espera que las parcelas que estn ms abajo reciban ms humedad en el suelo que las que
estn ms arriba (por ejemplo, las parcelas 9-12 van a tener ms humedad que las parcelas 1-4).
a. Qu diseo experimental recomendara para este experimento? Justifique brevemente.
b. Asigne los nematicidas a las parcelas aleatoriamente (de acuerdo al diseo escogido en a).
Escriba el cdigo de tratamiento asignado (N1, N2, N3 o N4) dentro de cada parcela.
c. Presente una tabla con las fuentes de variacin y los grados de libertad (en nmeros).

3. Para comparar cuatro preparaciones diferentes realizadas con harina de ame, un panel de
12 jueces realizar una evaluacin sensorial de los alimentos ofrecidos. Cada juez
probar las cuatro preparaciones, en un orden aleatoriamente escogido (diferente para
cada juez). Luego de probar el alimento, el juez le da un score entre 1 y 10. Los datos
estn disponibles en la pgina del curso.

Juez Prep Score


1 4 4
1 3 4
1 1 4
1 2 5
2 4 5

12 1 9
12 2 8

a. Prepare una tabla de ANOVA en InfoStat.


b. Formule y pruebe las hiptesis de inters. Use =0.05. Indique sus conclusiones
en trminos de este problema.

Potrebbero piacerti anche