Sei sulla pagina 1di 6

EJERCICIOS

ANALISIS DE VARIANZA CON UN FACTOR


El anlisis de varianza con un factor nos permite estudiar la relacin entre
variables, en que el factor (o variable independiente) tiene diferentes niveles, es
decir se agrupa en diferentes categoras. As podemos saber si es que existe algn
efecto del factor sobre la variable respuesta.
Revisaremos entonces el siguiente ejemplo:
1. Ciertos estudiosos afirman que las plantas pueden reducir el
nivel de estrs de los seres humanos. Para verificar este fenmeno,
dos semanas antes de los exmenes finales, 30 estudiantes
participaron en un experimento cuyo objetivo era determinar el
efecto que tiene la presencia de una planta viva, una foto de una
planta y la ausencia de plantas sobre la capacidad de relajacin de
un estudiante. Cada estudiante particip en una sesin, durante la
cual fue medida la temperatura de los dedos de la mano. Ya que
una temperatura creciente de los dedos indica un aumento en el
nivel de relajacin, la temperatura fue la variable seleccionada para
medir el estrs.
En este ejemplo podemos ver que el factor seria la presencia de plantas,
siendo la variable respuesta el nivel de estrs, medido en funcin de la temperatura
de los dedos de la mano.
Los datos obtenidos para el estudio son los siguientes:
Con plantas Con Foto Sin Plantas
91,4
93,5
96,6
94,9
96,6
90,5
97
95,8
95,4
93,7
96,2
96,7
96
96,6
93,5
96,7
95,5
94,8
95,2
94,6
95,7
96
97,2
96,2
95,6
94,8
96
95,6
92,6
96,6
Siendo Yij la temperatura del sujeto ubicado en la posicin j del i nivel del
factor, es decir, en este caso, i se refiere a la presencia de plantas siendo 1 con
planta, 2 con foto y 3 sin plantas; y j se refiere a la posicin dentro de i. Es asi que
i va desde 1 hasta k, siendo k el numero de niveles del factor, en este caso 3, y j va
desde 1 hasta ni, siendo ni el total de observaciones por nivel respectivamente, en
este 10 para cada uno de los niveles del factor.
Por lo tanto para comprobar si existe algn efecto del factor sobre la variable
respuesta realizaremos un test de hiptesis donde Ho dir que no existen
diferencias significativas en los efectos de los diferentes niveles del factor, y Ha dir
que entre algunos de los niveles del factor existir una diferencia significativa. Por
lo tanto, necesitamos refutar Ho si es que queremos demostrar que existe alguna
influencia de la presencia de plantas sobre el estrs. Para esto realizamos el anlisis
de varianza, donde el calculo de las diferentes medias cuadrticas apunta a
conseguir el valor F, que nos indica el efecto real del factor, por lo que mientras mas

grande mayor evidencia de un efecto real, pero como saber cuan grande tiene que
ser, para eso hay que calcular el valor critico de F con k-1 y n-k grados de libertad y
un cierto nivel de significacin (para este caso ocuparemos un nivel de significacin
de 95%), estos valores ya estn calculados estando disponibles en la tabla F,
ubicndose k-1 en las columnas y n-k en las filas. Es as que si el valor F obtenido
como cuociente de las medias cuadrticas es mayor al valor critico de F, obtenido
en la tabla, contamos con evidencia de que existe un efecto real.
Los resultados del anlisis de varianza suelen presentarse en el formato de
la siguiente tabla, llamada tabla de ANOVA

Fuente de Variacion Grados de Suma de


Libertad
cuadrados
Factor
k-1
SCF
Error
Total

n-k
n-1

SCE
SCT

Media
cuadratica
MCF
MCE

MCF
MCE

En el ejemplo del estudio acerca del efecto de la presencia de plantas sobre


el estrs el procedimiento seria el siguiente:
Con plantas Y1 Con foto Y2 Sin plantas Y3
91,4
93,5
96,6
94,9
96,6
90,5
97
95,8
95,4
93,7
96,2
96,7
96
96,6
93,5
96,7
95,5
94,8
95,2
94,6
95,7
96
97,2
96,2
95,6
94,8
96
95,6
92,6
96,6
Total

952,1

953,4

952,0

Es as que tenemos que:

SCF

ni

SCE Yij
i

SCT Yij
i

= 272.176,99 - 272.176,88 = 0,11

( Yij ) 2

ij

( Yij ) 2

272.253,45 - 272.176,99 = 76,46

ni

272.253,45 - 272.176,88 = 76,57

ij

MCF

SCF
k 1

MCE

SCE
nk

= 76,46 / 27 = 2.83

F=

MCF
MCE

0,11 / 2 = 0,05

= 0.05 / 2.83 = 0.02

Por lo que los resultados ordenados en la tabla de ANOVA son:

Fuente de Variacion Grados de Suma de


Libertad
cuadrados
Factor
k-1
0,11
Error
n-k
76,46
Total
n-1
76,57
F

0,95(2,27)

Media
cuadratica
0,05
2,83

F
0,02

= 3,35

Es as que como el valor F obtenido es menor al F crtico no se rechaza la


hiptesis nula, por que los datos no permiten asegurar que existe algn efecto
significativo de las plantas sobre el nivel de estrs.
Coeficiente de Determinacin, Comparaciones Mltiples y Efectos del
Factor
En el caso en que existiera evidencia de que haya un efecto significativo del
factor sobre la variable respuesta, aun no sabemos como es este, ni entre que
niveles del factor, por lo que se hace necesario calcular ciertos indicadores que nos
permitan concluir acerca de cmo es este efecto.
Revisaremos entonces esto con el siguiente ejemplo:
2. Una lista de palabras sin sentido se presenta en la pantalla de
un computador con cuatro procedimientos diferentes, asignados al
azar a un grupo de sujetos. Posteriormente se les realiza una
prueba de recuerdo de dichas palabras, obtenindose los siguientes
resultados:
Proc 1 Proc 2 Proc 3 Proc 4
5
9
8
1
7
11
6
3
6
8
9
4
3
7
5
5
9
7
7
1
7
4
4
4
4
2

Y al realizar el anlisis de varianza se obtuvieron los siguientes


resultados:

ANLISIS DE VARIANZA
Origen de
Grados de
Suma de
Media
F
las
libertad
cuadrados
cuadratica
variaciones
Factor
3
82,222
27,407
Error
22
85,932
3,906
Total
168,154

Valor crtico
para F
7,017

3,049

Con este ejemplo, ya que el valor F obtenido es mayor al valor critico, podemos
afirmar que hay evidencia suficiente de un efecto significativo del procedimiento
sobre el recuerdo, por lo que se rechaza Ho.
Con el Coeficiente de Determinacin podemos saber en que porcentaje
es explicada la variacin de la variable respuesta, por el factor.
La formula es:

R2

SCF
= 82,22 / 168,15 = 0,49
SCT

Por lo tanto, ya que el resultado es 0.49, podemos interpretar que la varianza del
recuerdo es explicada en un 48.9% por la utilizacin de diferentes procedimientos.
Para ver si las diferencias en cuanto al efecto entre los diferentes niveles del
factor, en este caso entre los diferentes procedimientos, realizamos el
procedimiento
de
Comparaciones
Mltiples,
comparando
todos
los
procedimientos entre si, utilizando la siguiente formula:

Donde S corresponde a la raz de MCE.


Es importante destacar que de la resta de los promedios de Yi se tiene que
expresar en valores absolutos, ya que lo que importa es la distancia a la que se
encuentran estos, por lo que el resultado se tiene que expresar en valores
positivos, independiente de si es negativo.
El resultado obtenido con esta formula se compara con el valor crtico
obtenido de la siguiente forma:

(k 1) F ,k 1,n k
Por lo tanto en este caso, la comparacin entre Proc 1 y Proc 2 seria:

= 5,375 - 8,4 / 1,98 * (1/8 + 1/5) = 4,71

(k 1) F ,k 1,n k

((4-1)*3,05) = 3,03

Por lo tanto como el valor t obtenido es mayor al critico, podemos afirmar


que existe una diferencia significativa entre los efectos de los niveles 1 y 2 del
factor, es decir, entre Proc 1 y Proc 2. As sucesivamente se comparan entre si
todos los niveles del factor encontrando los siguientes resultados:
t(1,2)
t(1,3)
t(1,4)
t(2,3)
t(2,4)
t(3,4)

=
=
=
=
=
=

4,71
1,45
4,12
3,33
7,45
5,14

Por lo que podemos interpretar que las diferencias significativas se dan entre
los procedimientos 1-2, 1-4, 2-3, 2,4 y 3-4, entre los procedimiento 1-3 no hay
diferencias significativas, y los que presentan mayor diferencia entre si son 2-4.
Ahora, para saber en que medida estn influyendo los procedimientos sobre
el recuerdo, se calculan los Efectos del Factor. Para esto calculamos la diferencia
entre el promedio del total de los casos medidos y el nivel del factor del que
queremos saber el efecto, como muestra la siguiente formula:

i Yi Y
Por lo que el efecto del primer nivel del factor, en este caso Proc 1, seria:

i Yi Y = 5,62 5,38 = -0,24


Mientras mas cercano a 0, menor es el efecto del factor, por lo que en este
caso podemos ver que el primer procedimiento utilizado, tiene un efecto mnimo
sobre el factor. El resto de los resultados fueron los siguientes:
1 =
2 =
3 =
4 =

-0,24
2,78
0,53
-2,62

De estos resultados se puede interpretar que el procedimiento 2 es el que


tiene el mayor efecto positivo sobre la variable respuesta, y el procedimiento 4
afecta negativamente al recuerdo, estando los otros dos muy cercanos a cero por lo
que no tienen mayor efecto.

3. Propuesto. Se desea saber si el grado de ansiedad es el mismo, por trmino


medio, en tres enfermedades distintas. Para ello se tomaron tres muestras de
10, 12 y 8 personas, respectivamente, con esas enfermedades, pasndole a
cada una de ellas un test que mide el grado de ansiedad del individuo. Los
resultados se dan en la tabla adjunta:
Enfermedad
A
B
C

4
2
7

6
1
5

5
5
8

Grado
5 6
5 4
7 9

de
3
6
3

ansiedad
3 2 6 5
4 4 4 3
5 5

a) Diga cul es el anlisis apropiado a los datos y porqu?


b) Cules son las variables en estudio? Diga que nombres reciben segn el
anlisis apropiado mencionado en (a) e indique si alguna de ellas tiene
niveles y cuales son.
c) Calcule la tabla de medias. Interprete descriptivamente y diga si observa
alguna diferencia entre ellas.
d) Realice el anlisis correspondiente, seale las hiptesis y concluya. Use nivel
de significacin 5 %.
e) Cul es el coeficiente de determinacin? Interprete.
f) Cul es el modelo apropiado? Escrbalo segn la notacin conocida.
g) Si rechazo la hiptesis nula en , analice entre qu grupos se producen las
diferencias. Interprete.
h) Estime el efecto del factor. Interprete.

4. Propuesto. Tres grupos de conejillos de indias se inyectaron, cada uno, con


respectivamente 0.5 miligramos, 1.0 miligramo y 1.5 miligramos de un nuevo
tranquilizante. A continuacin se muestra el nmero de minutos que tardaron en
quedarse dormidos.

05. mg
1.0 mg
1.5 mg

21
19
15

23
21
10

19
20
13

24
18
14

25
22
11

23
20
15

Pruebe en el nivel 0.05 de significancia si se puede rechazar la hiptesis nula


de que las diferencias en dosificacin no tienen efecto.
a)
b)

Seale cuales son las hiptesis a contrastar.


Realice la hiptesis previa de igualdad de varianzas, detallando las
hiptesis.
c)
Realice la tabla Anova.
d)
Si rechaza la hiptesis nula en (c), analice cul o cuales pares de
diferencias de medias son estadsticamente significativas.

Potrebbero piacerti anche