Sei sulla pagina 1di 67

Capítulo III

DISEÑO COMPLETO AL AZAR (DCA)

Docente: Ing. Alcides RAMOS CALCINA


Diseño Completo al Azar (DCA)
BALANCEADO
Faculta de Ingeniería Estadística e Informática
Ing. Alcides Ramos Calcina
Características

• Es el diseño más simple y sencillo de realizar, en el cual los


tratamientos se asignan al azar entre las unidades
experimentales (UE) o viceversa.

• Este diseño tiene amplia aplicación cuando las unidades


experimentales son muy homogéneas, es decir, la mayoría de los
factores actúan por igual entre las unidades experimentales. Esta
situación se presenta en los experimentos de laboratorio donde
casi todos los factores están controlados. También en pruebas de
ingeniería y experimentos industriales. Debido a su simplicidad,
el Diseño Completamente al Azar es usado frecuentemente.

• El diseño completamente al azar proporciona el máximo número


de grados de libertad para la estimación del error experimental;
además, no requiere estimar datos faltantes, es decir, el diseño
puede analizarse con diferente número de repeticiones por
tratamiento.
Ing. Alcides Ramos Calcina
Ventajas

a) Es simple de planificar.
b) El número de repeticiones puede variar de
tratamiento a tratamiento.
c) Existe más grados de libertad para estimar
el error experimental.
d) Es flexible en cuanto al número de
repeticiones y tratamientos.
e) Es útil cuando las unidades experimentales
tienen una variabilidad uniforme repartida.
f) Cuando se pierde alguna parcela
experimental se puede considerar que se
tenía diferente número de repeticiones por
tratamiento.
g) El Error Experimental puede obtenerse
separadamente para cada tratamiento para
comprobar la suposición de Homogeneidad
del Error.
Ing. Alcides Ramos Calcina
Desventajas

a) Es más apropiado para pequeño


número de tratamientos y para un
material experimental homogéneo y
uniformemente distribuido.
b) No se puede controlar el Error
Experimental, por lo tanto, no es un
Diseño muy preciso.
c) Cuando se tiene diferente número de
repeticiones por tratamiento, es
necesario calcular un Error estándar
por cada pareja de medias si se
quiere comparar sus diferencias.

Ing. Alcides Ramos Calcina


Modelo Estadístico Lineal

En este diseño el valor de cada unidad experimental yij se aplica según el


siguiente modelo estadístico lineal.

yij     i  eij
donde:

yij : Es una observación en la j-ésima unidad experimental, sujeto al i-


ésimo tratamiento.

 : Es el efecto de la media general o constante común.

i : Es el efecto del i-ésimo tratamiento.

eij Efecto verdadero de la j-ésima unidad experimental (replica), sujeta al


i-ésimo tratamiento (error experimental).

Ing. Alcides Ramos Calcina


Tabla de Analisis de Varianza (ANVA)

Donde:
t r r
t r  y ij y ij
y..   yij y..  i 1 j 1
yi .  j 1
i 1 j 1 tr r

Ing. Alcides Ramos Calcina


Coeficiente de Variabilidad (C.V.%)

Es una medida de variabilidad relativa (sin unidades de medida) cuyo uso


es para cuantificar en términos porcentuales la variabilidad de las unidades
experimentales frente a la aplicación de un determinado tratamiento.

• En experimentación no controlada (condiciones de campo) se considera


que un coeficiente de variabilidad mayor a 30% es elevado.

• En condiciones controladas (laboratorio) se considera un coeficiente de


variabilidad entre 1% a 8%. La expresión estimada del coeficiente de
variabilidad es:

t r t
yi2.
 y  
i 1 j 1
2
ij
i 1 r
 100
t 1 CM error
C.V .(%)    100
y.. y..

Ing. Alcides Ramos Calcina


Procedimiento para la prueba estadística de
hipótesis

Ing. Alcides Ramos Calcina


Procedimiento para la prueba estadística de
hipótesis

Ing. Alcides Ramos Calcina


Tipos de Modelo

En los tipos de modelo se distinguen dos situaciones según la selección de


los tratamientos: modelo de efectos fijos y modelo de efectos aleatorios.

• En el modelo de efectos fijos el experimentador decide qué niveles


concretos se van a considerar y las conclusiones que se obtengan sólo
son aplicables a esos niveles, no pudiéndose hacer extensivas a otros
niveles no incluidos en el estudio.

• En el modelo de efectos aleatorios, los niveles del factor se


seleccionan al azar; es decir los niveles estudiados son una muestra
aleatoria de una población de niveles y las conclusiones que se
obtengan se generalizan a todos los posibles niveles del factor, hayan
sido explícitamente considerados en el estudio o no.

Ing. Alcides Ramos Calcina


Verificación de los Supuestos del Modelo

La validez de los resultados obtenidos en cualquier análisis de varianza


queda supeditada a que los supuestos del modelo se cumplan. Estos
supuestos son:

• normalidad
• varianza constante (igual varianza de los tratamientos) e
• independencia.

1. NORMALIDAD
A) Gráfico
- Histograma de residuales - Grafico de probabilidad normal

Ing. Alcides Ramos Calcina


Verificación de los Supuestos del Modelo

B) Prueba Estadística
Shapiro – Wilk (muestras pequeñas: n <= 30) y
Kolmogorov – Smirnov (muestras grandes: n > 30)

2. HOMOGENEIDAD DE VARIANZAS
A) Gráfico
- Grafica de los residuales contra los valores ajustados

Ing. Alcides Ramos Calcina


Verificación de los Supuestos del Modelo

- Grafica de barras de error

B) Prueba Estadística
- Prueba de Bartlett
- Prueba de Levene
Ing. Alcides Ramos Calcina
Verificación de los Supuestos del Modelo

3. INDEPENDENCIA
A) Gráfico
- Gráfica de residuales en secuencia en el tiempo

B) Prueba Estadística
- Prueba de Durwin-Watson

Ing. Alcides Ramos Calcina


EJEMPLOS
Ejemplo 1:

Un ingeniero desea conocer los efectos del alcohol en la destreza de


los trabajadores para realizar ciertas tareas. Para ello se eligen al azar
20 trabajadores que subdividimos aleatoriamente en cuatro equipos
de cinco y a los que se les aplica, también aleatoriamente cuatro
tratamientos distintos: T1: Sin alcohol, T2: Baja dosis de alcohol, T3:
Media dosis de alcohol y T4: Alta dosis de alcohol. Los tiempos que
tardan en realizar las tareas aparecen en la tabla 2. ¿Hay indicios
suficientes de que existan diferencias los tiempos medios de los
cuatro equipos? ( = 0.05).
Tabla 2: Tiempos que tardan en realizar las tareas sin errores los trabajadores con
cuatro niveles de alcohol.
Tratamientos Tiempos (seg.)
Equipo 1: Sin alcohol 42, 39, 48, 43, 44
Equipo 2: Baja dosis de alcohol 45, 46, 45, 39, 43
Equipo 3: Media dosis de alcohol 64, 61, 50, 55, 58
Equipo 4: Alta dosis de alcohol 56, 55, 62, 59, 60

Ing. Alcides Ramos Calcina


Solución:

a) DESCRIPCIÓN DE COMPONENTES

Hipótesis de investigación:
El no consumo de alcohol permitirá realizar las tareas sin errores
en tiempos muy cortos.

Diseño del tratamiento:


El diseño del tratamiento desarrollado por el ingeniero para evaluar
la hipótesis incluyó los siguientes tratamientos:
T1: Sin alcohol
T2: Baja dosis de alcohol
T3: Media dosis de alcohol
T4: Alta dosis de alcohol

Ing. Alcides Ramos Calcina


Solución:

Diseño del experimento:


 Se usó un diseño totalmente aleatorizado para el experimento.
 A cada tratamiento se le asignaron al azar 5 trabajadores de la
misma obra.
 Después de ingerir la dosis en una instalación normal, se anotó
los tiempos que corresponden a la realización de las tareas sin
errores.

Variable de respuesta:
Tiempo que tardan los trabajadores (en segundos) en realizar
correctamente la tarea asignada.

Unidad experimental (UE):


Trabajadores.

Ing. Alcides Ramos Calcina


Solución:

b) DEFINICIÓN DEL MODELO


Modelo Estadístico Lineal (MEL):

yij     i  eij
donde:

yij : Es el j-ésimo tiempo en realizar una tarea, sujeto a la i-ésima dosis


de alcohol.

 : Es la media general de los tiempos de realizar tareas.

i : Es el efecto de la i-ésima dosis de alcohol.

eij : Es el error experimental.

Ing. Alcides Ramos Calcina


Solución:

c) ANALISIS DE VARIANZA (ANVA)


Cálculos básicos:

Grados de libertad:

GLtrat = t – 1 = 4 – 1 = 3
GLerror = t (r – 1) = 4 (5 – 1) = 16
GLtotal = N - 1 = 20 – 1 = 19

Ing. Alcides Ramos Calcina


Solución:

Suma de Cuadrados:

Ing. Alcides Ramos Calcina


Solución:

Cuadro ANVA:

Prueba Estadística de Hipótesis:

Ing. Alcides Ramos Calcina


Solución:

Ing. Alcides Ramos Calcina


Verificación de resultados en SPSS

Para realizarlo mediante SPSS, se comienza definiendo las variables e


introduciendo los datos:
Vista de variables

Valores de la variable dosis:

Ing. Alcides Ramos Calcina


Verificación de resultados en SPSS

Vista de datos:

Ing. Alcides Ramos Calcina


Solución:

Antes de realizar el análisis


de varianza, siempre es una
buena idea examinar
gráficamente los datos
experimentales.

Diagramas de caja para el


tiempo de solución de sumas
con cada nivel de dosis de
alcohol.

Gráficos / Generar gráfico


Luego, Aceptar.

Ing. Alcides Ramos Calcina


Solución:

El grafico muestra los diagramas de caja para el tiempo de realizar la tarea


con cada nivel de dosis de alcohol.

Ing. Alcides Ramos Calcina


Solución:

En segundo lugar describimos los cuatro equipos que tenemos que comparar,
las cuatro dosis de alcohol.

Para la descripción de los cuatro equipos comenzamos realizando un análisis


descriptivo. Para ello, se selecciona, en el menú principal: Analizar / Comparar
medias / medias

Ing. Alcides Ramos Calcina


Solución:

Pulsar Continuar y Aceptar y se obtiene la siguiente salida:

Ing. Alcides Ramos Calcina


Solución:

Para responder a esta hipótesis recurrimos al Análisis de la Varianza de un


factor y realizamos el contraste de igualdad de medias

mediante SPSS dicho contraste se puede ejecutar de dos formas:

a) Se selecciona, en el menú principal, Analizar/Comparar medias/ANOVA de


un factor… En la salida correspondiente,

Ing. Alcides Ramos Calcina


Solución:

Pulsando Aceptar se obtiene la Tabla ANOVA

Se observa que el P-valor (Sig.) tiene un valor de 0.000, que es menor que el
nivel de significación 0.05. Por lo tanto, hemos comprobado estadísticamente
que estos cuatro grupos son distintos.

Ing. Alcides Ramos Calcina


Solución:

b) Se selecciona, en el menú principal, Analizar / Modelo lineal general /


Univariado… ,

Ing. Alcides Ramos Calcina


Solución:

Es importante obtener los residuos del modelo, pues estos nos permitirán
realizar la validación del modelo, es decir, el cumplimiento de los supuestos.
Para esto elegimos la opción Guardar.

Pulsando Continuar y luego Aceptar se obtiene


la Tabla ANOVA
Ing. Alcides Ramos Calcina
Solución:

En la Tabla ANOVA, el valor del estadístico de contraste de igualdad de medias,


F = 25.378 deja a su derecha un p-valor de 0.000, menor que el nivel de
significación del 5%, por lo que se rechaza la Hipótesis nula de igualdad de
medias. Es decir, existen diferencias significativas en los tiempos de realización
de las tareas con las cuatro dosis de alcohol.
Ing. Alcides Ramos Calcina
Solución:

La salida de SPSS también nos muestra que R cuadrado vale 0.826,


indicándonos que el modelo explica el 82.6% de la variabilidad de los datos.

El modelo que hemos propuesto hay que validarlo, para ello hay que comprobar
si se verifican las hipótesis básicas del modelo, es decir, si las perturbaciones
son variables aleatorias independientes con distribución normal de media 0 y
varianza constante (homocedasticidad).

Ing. Alcides Ramos Calcina


Cumplimiento de supuestos:

NORMALIDAD

Para analizar la hipótesis de normalidad de los residuos, se debe comenzar salvando los
residuos. Este procedimiento se realizo anteriormente y por tanto, los residuos se pueden
ver en la ventana de datos como se muestra en la figura:

El estudio de la Normalidad de
los residuos (RES_1), lo
realizamos mediante
procedimientos gráficos
(Histograma y Gráfico
probabilístico Normal) y
procedimientos analíticos
(Contraste de Kolmogorov-
Smirnov).

Ing. Alcides Ramos Calcina


Normalidad:

Histograma: Se selecciona en el menú principal, Gráficos / Cuadros de diálogos


antiguos / Histograma

Introducimos en el
campo Variable: la
variable que recoge los
residuos RES_1, se
selecciona Mostrar
curva normal. Se pulsa
Aceptar

Ing. Alcides Ramos Calcina


Normalidad:

Histograma:

Como se observa en este


gráfico, los datos están
concentrado entorno a cero,
entonces existen indicios de
que los errores sean
normales.
Ing. Alcides Ramos Calcina
Normalidad:

Gráfico probabilístico Normal: Se selecciona en el menú principal, Analizar /


Estadísticos descriptivos / Gráficos Q-Q

Introducimos en
el campo
Variables:
RES_1.
Se pulsa Aceptar

Ing. Alcides Ramos Calcina


Normalidad:

Gráfico probabilístico Normal:

La gráfica resultante se muestra que no hay evidencia suficiente en contra de la


normalidad de los datos, dado que los puntos están muy próximos a la diagonal.

Ing. Alcides Ramos Calcina


Normalidad:

Prueba de Kolmogorov-Smirnov y Shapiro-Wilk: Se selecciona en el menú


principal: Analizar / Estadísticos descriptivos / Explorar…

Introducimos en el campo Lista de dependientes: La variable respuesta RES_1. Se


pulsa Gráficos y se selecciona Gráficos con pruebas de normalidad. Pulsando
Continuar y Aceptar se obtiene los siguientes contrastes de normalidad:

Ing. Alcides Ramos Calcina


Normalidad:

Prueba de Kolmogorov-Smirnov y Shapiro-Wilk:

Observamos el contraste de Shapiro-Wilk que es adecuado cuando las muestras son


pequeñas (n<=30) y es una alternativa más potente que el test de Kolmogorov-
Smirnov. El valor de probabilidad asociado al estadístico (Sig. = 0.998) es mayores
que el nivel de significancia 0.05. Concluyendo que los residuales del modelo se
distribuyen de forma normal.

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

En primer lugar comprobamos la homocedasticidad gráficamente, para ello se necesita


guardar los valores ajustados o predichos.

Se selecciona, en el menú principal, Analizar / Modelo lineal general / Univariado… ,

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

Los valores ajustados se pueden ver en la ventana de datos como se muestra en la


figura:

Para el estudio de la igualdad


de varianzas de los residuos
(RES_1), lo realizamos
mediante procedimientos
gráficos: Residuales vs
Predichos.

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

Grafica de los residuales contra los valores ajustados: Se selecciona en el


menú principal: Gráficos / Generador de gráficos …

Seleccionamos en la pestaña
Galería: El tipo de gráfico
Dispersión de Puntos y lo
arrastramos a la vista previa del
gráfico, luego también arrastramos
las variables RES_1 y PRE_1 a la
ventana de vista previo del gráfico,
como se muestra en la figura:

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

Grafica de los residuales contra los valores ajustados:

En este gráfico se
muestran los residuales
contra los valores
pronosticados para los
datos del tiempo de
solución de sumas.
Aquí no se aprecia
ningún patrón de
comportamiento tipo
embudo que nos
pudiera indicar la
heterogeneidad de las
varianzas, por tanto,
existen indicios de
homogeneidad.

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

Barrar de errores: Se selecciona en el menú principal: Gráficos / Cuadros de


diálogos antiguos / Barras de error…

En Las barras representan se


selecciona Desviación típica, en
Multiplicador: 2 (nos interesa que la
desviación típica esté multiplicada
por dos). Se pulsa Aceptar.

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

Barrar de errores:

Observamos que el
Tratamiento 3: Media
dosis hay mucha más
dispersión que el resto
de los tratamientos que
son muy similares en su
variabilidad. Del gráfico
no se deduce
directamente si hay
homogeneidad en estas
varianzas, por lo que
recurrimos analizar la
heterocedasticidad
analíticamente mediante
el test de Levene.

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

Prueba de Levene: Se selecciona en el menú principal: Analizar / Comparaciones


de medias / ANOVA de un factor … en la ventana de ANOVA de un factor… pulsar
Opciones.

Se selecciona Prueba de
homogeneidad de las varianzas y
Gráfico de las medias. Se pulsa
Continuar y Aceptar

Ing. Alcides Ramos Calcina


Homogeneidad de Varianzas:

Prueba de Levene:

El p-valor es 0.400 por lo tanto no se


puede rechazar la hipótesis de
homogeneidad de las varianzas y se
concluye que los cuatro grupos
tienen varianzas homogéneas.
En esta gráfica observamos que a
mayor cantidad de dosis de alcohol
se demora más en resolver las
sumas.

Ing. Alcides Ramos Calcina


Independencia:

Grafica de los residuales contra el tiempo: Para realizar este gráfico tenemos
que agregar una variable OBS (Observaciones), luego realizamos lo siguiente: Gráficos /
Generador de gráficos …

Seleccionamos en la pestaña
Galería: El tipo de gráfico
Dispersión de Puntos y lo
arrastramos a la vista previa del
gráfico, luego también arrastramos
las variables RES_1 y OBS a la
ventana de vista previo del gráfico,
como se muestra en la figura:

Ing. Alcides Ramos Calcina


Independencia:

Grafica de los residuales contra el tiempo:

Los residuales en la
secuencia del tiempo
no parecen mostrar
un patrón de
comportamiento, por
tanto, no hay razón
para sospechar
cualquier violación
delo supuesto de
independencia.

Ing. Alcides Ramos Calcina


EJEMPLOS
Ejemplo 1 - Solución:

En la consola de R ingresamos los datos, de acuerdo al arreglo de


datos:

# Ingreso de datos
> tiempo<-c(42,39,48,43,44,45,46,45,39,43,64,61,50,55,58,56,55,
62,59,60)
> trat<-c(rep(1:4,rep(5,4)))

En R es imprescindible definir los datos en un tipo Data.frame, ya


que en caso contrario se podría confundir con un vector numérico.

> datos<-data.frame(trat=factor(trat,labels=c("Sin alcohol","Baja


dosis","Media dosis","Alta dosis")),tiempo)
> datos
Ing. Alcides Ramos Calcina
Ejemplo 1 - Solución:

Antes de realizar el análisis de varianza, siempre es una buena idea


examinar gráficamente los datos experimentales.

> plot(datos)

Ing. Alcides Ramos Calcina


Ejemplo 1 - Solución:

Se define el modelo DCA para un factor y luego se obtiene el


cuadro de análisis de varianza para la variable de respuesta tiempo.

> respuesta<-aov(tiempo~trat,data=datos)
> anova(respuesta)

Analysis of Variance Table

Response: tiempo
Df Sum Sq Mean Sq F value Pr(>F)
trat 3 1067.8 355.93 25.378 2.539e-06 ***
Residuals 16 224.4 14.02
---
Signif. codes:0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Ing. Alcides Ramos Calcina


Ejemplo 1 – Verificación de supuestos:

NORMALIDAD:
a) Gráfico
- Histograma de los residuales

> hist(respuesta$residuals)

Ing. Alcides Ramos Calcina


Ejemplo 1 – Verificación de supuestos:

- Gráfico de probabilidad normal

> qqnorm(respuesta$residuals)
> qqline(respuesta$residuals)

Ing. Alcides Ramos Calcina


Ejemplo 1 – Verificación de supuestos:

NORMALIDAD:
b) Prueba estadística
- Shapiro – Wilk (n <= 30)

> shapiro.test(respuesta$residuals)

Shapiro-Wilk normality test


data: respuesta$residuals
W = 0.98818, p-value = 0.9949

- Kolmogorov - Smirnov (n > 30)

ks.test(x,”Distribución”)

Ing. Alcides Ramos Calcina


Ejemplo 1 – Verificación de supuestos:

HOMOGENEIDAD DE VARIANZAS:
a) Gráfico
- Grafica de los residuales contra los valores ajustados

> plot(respuesta$fitted.values,respuesta$residuals)

Ing. Alcides Ramos Calcina


Ejemplo 1 – Verificación de supuestos:

- Grafica de los residuales contra factor

> plot(respuesta$residuals~trat)

Ing. Alcides Ramos Calcina


Ejemplo 1 – Verificación de supuestos:

HOMOGENEIDAD DE VARIANZAS:
b) Prueba Estadística
- Prueba de Bartlett

> bartlett.test(tiempo~trat)

Bartlett test of homogeneity of


variances

data: tiempo by trat


Bartlett's K-squared = 2.3372, df = 3,
p-value = 0.5054

Ing. Alcides Ramos Calcina


Ejemplo 1 – Verificación de supuestos:

INDEPENDENCIA:
- Gráfica de residuales en secuencia en el tiempo

> plot(respuesta$residuals,xlab="Orden de corrida")


> abline(h=0,lty=2)

Ing. Alcides Ramos Calcina


Ejercicio 1:

Se pretende comparar la duración de tres tipos


de pilas alcalinas de frecuente presencia en el
mercado. Para ello se mide la duración (en
horas) de cinco pilas de cada marca elegida al
azar, los datos se recogen a continuación.

Marca de pilas
I II III
100 76 108
96 80 100
92 75 105
96 84 102
92 82 100

a) Defina el modelo lineal.


b) ¿Qué se puede concluir acerca de la duración de estas tres marcas de
pilas? Use  = 5%
Ing. Alcides Ramos Calcina
Ejercicio 2:

Suponga que en un experimento un ingeniero esta interesado en cómo la


absorción media de humedad en concreto varia entre cinco mezclas
diferentes de concreto. Las muestras se exponen a la humedad por 48 horas.
Se deciden que se prueben seis muestras para cada mezcla, por lo que se
requiere probar un total de 30 muestras. Los datos se registran en la tabla..

Tabla 2: Absorción de humedad en mezcla de concreto


Mescla 1 Mescla 2 Mescla 3 Mescla 4 Mescla 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679

Realice el análisis de varianza y use  = 5%

Ing. Alcides Ramos Calcina

Potrebbero piacerti anche