Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
htm
Juan Vilar
Catedrtico de Estadstica e I.O. de la UDC
Web personal:
http://dm.udc.es/profesores/juanvilar
E-mail:
eijvilar@udc.es
ndice General
unidades experimentales,
factores nuisance (molestos): factores bloque, factores ruido y
covariables.
3. Elegir una regla de asignacin de las unidades experimentales a las
condiciones de estudio (tratamientos).
4. Especificar las medidas con que se trabajar (la respuesta), el procedimiento
experimental y anticiparse a las posibles dificultades.
5. Ejecutar un experimento piloto.
6. Especificar el modelo.
7. Esquematizar los pasos del anlisis.
8. Determinar el tamao muestral.
9. Revisar las decisiones anteriores. Modificarlas si se considera necesario.
Fuente
Tipo
Planificada y sistemtica
(Factores tratamiento)
Planificada y sistemtica
(Factores nuisance)
Aleatorizar
Aleatorizar todos los factores no controlados por el experimentador en el
diseo experimental y que puden influir en los resultados sern asignados al
azar a las unidades experimentales.
Ventajas de aleatorizar los factores no controlados:
Transforma la variabilidad sistemtica no planificada en variabilidad no
planificada o ruido aleatorio. Dicho de otra forma, aleatorizar previene contra
la introduccin de sesgos en el experimento.
Evita la dependencia entre observaciones al aleatorizar los instantes de
recogida muestral.
Valida muchos de los procedimientos estadsticos ms comunes.
Bloquear
Se deben dividir o particionar las unidades experimentales en grupos
llamados bloques de modo que las observaciones realizadas en cada bloque se
realicen bajo condiciones experimentales lo ms parecidas posibles.
A diferencia de lo que ocurre con los factores tratamiento, el experimentador
no est interesado en investigar las posibles diferencias de la respuesta entre
los niveles de los factores bloque.
Bloquear es una buena estrategia siempre y cuando sea posible dividir las
unidades experimentales en grupos de unidades similares.
La ventaja de bloquear un factor que se supone que tienen una clara
influencia en la respuesta pero en el que no se est interesado, es la
siguiente:
Convierte la variabilidad sistemtica no planificada en variabilidad
sistemtica planificada.
Con el siguiente ejemplo se trata de indicar la diferencia entre las
estrategias de aleatorizar y de bloquear en un experimento.
Ejemplo 2.1.
Se desea investigar las posibles diferencias en la produccin de dos
mquinas, cada una de las cuales debe ser manejada por un operario.
Los factores bloque estn anidados si cada nivel particular de uno de los
factores bloque ocurre en un nico nivel del otro factor bloque.
Diseo con factores bloque anidados o jerarquizados. Dos factores
bloque se dicen anidados cuando observaciones pertenecientes a dos niveles
distintos de un factor bloque estn automticamente en dos niveles distintos
del segundo factor bloque.
En la siguiente tabla puede observarse la diferencia entre ambos tipos de
bloqueo.
Bloques Cruzados
Bloques Anidados
Bloque 1
Bloq
ue 2
Bloque 1
Bloq
ue 2
Bloq.1
Bloq.2
Bloq.J
Trat.1
y11
y12
y1J
Trat.2
y21
y22
y2J
Trat.I
yI1
yI2
yIJ
(5.1)
siendo,
* Y el resultado del tratamiento i-simo, i = 1,2,...,I de T al bloque jsimo, j = 1,2,...,n .
ij
resultados.
es el efecto del tratamiento i-simo de T , i = 1,2,...,I. Mide el
efecto incremental del tratamiento del nivel i de T sobre el efecto
global. Se verifica que i = 1I = 0,
*
ij
(5.3)
frente a la alternativa de que s existen diferencias entre los valores medios
de los distintos tratamientos del segundo factor. Sin embargo en el modelo
tratamiento-bloque realizar este contraste carece de inters salvo para saber
si ha sido conveniente bloquear o no.
Por ello en la prctica:
Carece de inters plantearse la hiptesis nula de igualdad de los efectos
bloque. El nico objetivo puede ser el de concluir si bloquear el experimento
result o no beneficioso.
En efecto, si la suma de cuadrados medios atribuibles a los bloques es
considerablemente mayor que la suma de cuadrados medios residual, habr
resultado til bloquear en el sentido de que tal accin deriv en una
reduccin del tamao del error experimental. En otro caso, bloquear es
contraproducente.
(5.6)
(5.7)
Por tanto, la prediccin en la casilla
es
(5.8)
La suma de los residuos en cada fila y cada columna es cero, por tanto,
hay I + J - 1 relaciones entre los IJ residuos y el nmero de grados de libertad
es
(5.14)
(5.16)
esto es,
(5.13)
escrito de otra forma
Suma de
Variacin
Cuadrados
g.l.
scm
scmT =
scT =
Tratamientos
J
I1
scmT =
scB =
Bloques
J -1
I
scR =
Residual
i
(I
-1)
(J
-1)
scmR =
scG =
Global
Rechazar H0(1) :
= ... =
Rechazar H0(2) :
= ... =
scmG =
IJ 1
, segn p = P
, segn p = P
(5.14)
se rechaza H0(
al nivel de significacin si
>F
Si H0(
(5.15)
se rechaza H0(
al nivel de significacin si
Comentarios.
a partir de la
(5.16)
de forma anloga se puede hacer para las diferencias
Foto A
Foto B
Foto C
Foto D
Impresora 1 89
88
97
94
Impresora 2 84
77
92
79
Impresora 3 81
87
87
85
Impresora 4 87
92
89
84
Impresora 5 79
81
80
88
Solucin.
Foto A
Impresora 89
1
Foto B
88
Foto C
97
Foto D
94
92
Impresora 84
2
77
92
79
83
-3
Impresora 81
3
87
87
85
85
-1
Impresora 87
4
92
89
84
88
Impresora 79
5
81
80
88
82
-4
84
85
89
86
-2
-1
..
= 86
Predicciones
F. A
F. B
F. C
F. D
I.1 90
91
95
92
I.2 81
82
86
83
I.3 83
84
88
85
I.4 86
87
91
88
I.5 80
81
85
82
Residuos
F. A
F. B
F. C
F. D
I.1
-1
-3
I.2
-5
-4
I.3
-2
-1
I.4
-2
-4
I.5
-1
-5
La varianza residual es
Intervalos de confianza.
Intervalos de confianza al 90% para los parmetros del modelo son:
Para
Para
I3
= +
Para
Para
31
I3
I1
Fuentes de
Suma de
Grados de
variacin
cuadrados
libertad
scT
264
Varianzas
66'00
scB
70
23'33
scExplicada
334
47'71
scR
226
12
18'83
scG
560
19
29'47
H0
= ... =
= ... =
Fuentes de
Suma de
Grados de
Variacin
Cuadrados
libertad
scT
264
66'00
scR
296
15
19'73
scG
560
19
29'47
Ahora el contraste H0
= ... =
Varianzas
Test de Tuckey.
0 se verifica que
son valores grandes y del mismo signo, los residuos son altos, y
las predicciones
media.
ij
= +
ij
El significado de la interaccin
eje de abscisas los niveles de uno de los dos factores tratamiento, por
ejemplo el A, y se dibuja la nube de puntos
(5.22)
con
ijk
Donde,
es el resultado del tratamiento i-simo, i = 1,2,...,I del factor T y del
tratamiento j-simo, j = 1,2,...,n del factor T , en la replicacin t-sima, t =
Y
ijk
1,...,K.
Se verifica que
ijk
I
i=1
ij
J
j=1
ij
Parmetros
Nmero
I-1
J-1
ij
Total
IJ + 1
(5.23)
con
ijk
(5.25)
Los residuos, diferencia entre lo observado y la prediccin,
esto es,
Suma de
g.l.
scm
Variacin
Cuadrados
scT =
Factor F.T
scmT =
I-1
JK
scT =
Factor F.T
IK
2
ij
scR =
i
2
ijk
scG =
Global
i
(scmT ) /(scmR)
=
(scmT
) /(scmR)
scmG =
ij
= 0 i,j
<
entonces
Rechazar H0(
Rechazar H0(
Si se rechaza H0(
scmR =
en base al p-valor p = P(
(
) / ((I-1)(J-1))
IJK
-1
Rechazar H0
Si se acepta H0
scm
IJ(
K1)
Residual
(scmT ) /(scmR)
(scT ) / (J-1)
(I
-1)
(J
(xc
-1)
Inter.
K
scmT
J1
2
j
sc
(scT ) / (I-1)
2
i
= ... =
, segn p = P(
, segn p = (
<
<P
= ... =
ijt
ij
ijt
Si la hiptesis nula H0
cierta, se verifica que
ij
(5.27)
se rechaza H0
al nivel de significacin si
Si se acepta la hiptesis H0
de los dos factores.
Si la hiptesis nula H0(
cierta, se verifica que
>
,IJ
= ... =
(5.28)
se rechaza H0(
al nivel de significacin si
,IJ
= ... =
(5.29)
se rechazaH0(
al nivel de significacin si
es la siguiente
,IJ
Fuente de
Suma de
Variacin
Cuadrados
scm
scT =
Factor F.T
scmT =
I-1
JK
IK
Residual
j
e 2
ijk
scG =
Global
i
(scmT ) /(scmR)
(scT ) / (J-1)
(scmT ) /(scmR)
IJK
scmR =
-I
- J scR / ( IJK - I -J + 1 )
+1
scR =
i
scmT
J1
2
j
(scT ) / (I-1)
scT =
Factor F.T
scmG =
IJK
-1
Rechazar H0(
= ... =
, segn p = P(
<
Rechazar H0(
= ... =
, segn p = (
<
I-1,IJK-I-J+1
J-1,IJK-I-J+1
Lugar A
Hora 1
Hora 2
Hora 3
Lugar B
Lugar C
Lugar D
0'31
0'45
0'82
1'10
0'43
0'45
0'45
0'71
0'46
0'43
0'88
0'72
0'63
0'76
0'66
0'62
0'36
0'29
0'92
0'61
0'44
0'35
0'56
1'02
0'40
0'23
0'49
1'24
0'31
0'40
0'71
0'38
0'22
0'21
0'30
0'37
0'23
0'25
0'30
0'36
0'18
0'23
0'38
0'29
0'24
0'22
0'31
0'33
Solucin.
L-A
L-B
L-C
L-D
0'413
0'880
0'568
0'610
0'618
0'139
0'320
0'815
0'375
0'667
0'544
0'065
0'210
0'335
0'235
0'325
0'276
-0'203
. .
.j
0'314
0'677
0'393
0'534
-0'165
0'198
-0'086
0'055
H-1
1j
H-2
2j
H-3
3j
..
...
= 0'479
L-A
L-B
L-C
L-D
H-1
-0'040
0'064
0'036
-0'063
H-2
-0'059
0'073
-0'083
0'068
H-3
0'099
-0'139
0'045
-0'006
ij
Residuos
Hora 1
Hora 2
Hora 3
Lugar A
Lugar B
Lugar C
Lugar D
-0'103
0'037
-0'060
0'220
-0'138
-0'118
-0'160
0'100
0'047
0'017
0'000
-0'160
0'062
0'192
0'050
0'010
0'040
-0'030
0'105
-0'205
0'065
-0'025
-0'107
-0'353
0'080
-0'090
-0'325
0'425
-0'065
0'025
0'043
-0'287
0'010
0'000
-0'035
0'035
-0'005
0'015
-0'025
0'035
-0'030
0'020
0'045
-0'045
0'005
-0'015
-0'015
0'005
Tabla ANOVA
Utilizando las estimaciones y residuos obtenidos se obtiene la siguiente
tabla ANOVA
Tabla ANOVA
Fuentes de
Suma de
Grados de
cuadrados
libertad
Factor hora
1'0330
0'5165
23'222
0'0000
Factor lugar
0'9212
0'3071
13'806
0'0000
Interaccin
0'2501
0'0417
1'874
0'1123
Variab. Exp.
Total
2'2043
11
Residual
0'8007
36
0.0222
= 0'149
Global
3'0050
47
0'0639
= 0'253
variacin
scm
p - valor
no influye. Se realiza
no influye.
Parmetros
Nmero
1
I-1
J-1
R-1
ij
ir
jr
ijr
2
Total
1
IJR + 1
Los estimadores mximo-verosmiles de este modelo son los siguientes (se utiliza la
notacin habitual):
De la media global
Fuente de
variacin
Factor T
Suma de cuadrados
scT = J RK
I
i=1
g.l.
2
i
I-1
Factor T
Factor T
Inter.
Inter.
Inter.
Inter.
Residual
Global
scT = IRK
J
j=1
2
j
scT = IJK
R
r=1
sc
= RK
sc
= JK
i=1
sc
= IK
j=1
sc
=K
I
i=1
I
i=1
j=1
scR =
I
i=1
j=1
scG =
I
i=1
j=1
R
r=1
R
r=1
R-1
j=1
J-1
(I - 1)(J - 1)
2
ij
(I - 1)(R - 1)
2
ir
jr
(J - 1)(R - 1)
R
r=1
ijr
R
r=1
t=1
R
r=1
t=1
eijrk2
eijrk2
(I - 1)(J - 1)(R 1)
IJR(K - 1)
IJRK - 1
Tabla 5.4. Cuadro del anlisis de la varianza para un diseo completo de tres
factores.
5.6
Cuadro 2
Cuadro 3
Cuadro 4
lo impone el
donde,
* Y ij es el resultado del bloque i-simo, i = 1,...,K del factor bloque B y
del bloque j-simo, j = 1,...,J del factor-bloque B , y del nivel k-simo del
factor T . Se denota la k entre parntesis, para indicar que este ndice no se
elige sino que viene condicionado por el par ij.
* es el efecto global que mide el nivel medio de todos los resultados,
* i es el efecto (positivo o negativo) sobre la media global debido al
bloque i de B . Se verifica que i = 1I i = 0,
ij
distribucin N
Tabla ANOVA.
De la descomposicin de la variabilidad se obtiene la tabla ANOVA (Tabla
5.7.) de donde se deducen los siguientes contrastes:
se rechaza H0
al nivel de significacin si
(1.37)
se rechaza H0
al nivel de significacin si
= ... =
(1.38)
se rechaza H0
al nivel de significacin si
.
CUADRO DEL ANLISIS DE LA VARIANZA
MODELO CUADRADO LATINO
Fuente de
Suma de
Variacin
Cuadrados
g.l.
scm
Bloques
scmB =
scBF =
K-1
(B )
K
scmB =
scBC =
Bloques
(scmB ) / (scmR)
K-1
(B )
(scmB ) / (scmR)
scmT =
scTL =
Factor T
K-1
(T )
scmR =
scR =
(K-1)
(K-2)
Residual
i
(scmB ) / (scmR)
eij(k)2
scmG =
scG =
Global
K2 - 1
i
Rechazar H0(
Rechazar H0(
Rechazar H0(
:
)
= ... =
= ... =
= ... =
, segn p = P(
<
, segn p = P(
, segn p = P(
<
<
donde r
es el efecto rplica que se estimar por la
diferencia entre la media de cada rplica completa y la media general.
Seat
Ford
Opel
Renault
C1
21 A1
26 A2
20 A4
25 A3
C2
23 A4
26 A3
20 A1
27 A2
C3
15 A2
13 A4
16 A3
16 A1
C4
17 A3
15 A1
20 A2
20 A4
C. Latino
Solucin.
.i
..k
23
19
-1
18
-2
24
20
22
15
-5
19
-1
21
18
-2
22
19
-1
.. =
= 20
Seat
Ford
Opel
Renault
C1
1 A1
1 A2
-1 A4
-1 A3
C2
1 A4
1 A3
-1 A1
-1 A2
C3
-1 A2
-1 A4
1 A3
1 A1
C4
-1 A3
-1 A1
1 A2
1 A4
Tabla ANOVA
Fuentes de
Suma de
Grados de
variacin
cuadrados
libertad
Varianza
p - valor
Factor
conductor
216
72
27
0'0007
Factor coche
24
0'1117
Factor aditivo
40
13'33
0'0452
Variab.
Explicada
280
Residual
16
2'66
Global
296
15
19'73
se tienen dudas acerca de si aceptar o no esta hiptesis ya que su pvalor 0'05. Es el contraste ms interesante ya que se contrasta la
posible influencia del factor tratamiento en el que se est interesado.
(conductor) no influye.
(coche) no influye.
Fuentes de
Suma de.
Grados
Variacin
Cuadrados
libertad
Varianza
p - valor
Factor
conductor
216
72'00
16'20
0'0006
Factor aditivo
40
13'33
3'00
0'0877
Variab. Exp.
Total
256
Residual
40
4'44
Global
296
15
19'73