Sei sulla pagina 1di 7

Taller 4

ANLISIS DE VARIANZA I ( ANOVA un factor)


1. INTRODUCCIN
El objetivo de este taller es estudiar el efecto de un conjunto de factores sobre una
variable respuesta. El alumno debe revisar el apunte para recordar los aspectos
tericos del tema.
2. Desarrollo
2. 1 Opciones de Statgraphics para ANOVA
Statgraphics presenta los procedimientos sobre diseo de experimentos en la
opcin Compare de la barra de men. Utiliza el procedimiento Analysis of
Variance para estudiar la influencia de uno o ms factores sobre la variable
respuesta a travs de las opciones:
1. One-Way ANOVA: esta opcin estudia el efecto de un nico factor en la variable
respuesta.
2. Multifactor ANOVA: esta opcin estudia el efecto de dos o ms factores en una
variable respuesta.
2.2 Ejemplo 1
Se trabajar con los datos del archivo Heyl.sf3 correspondientes a las medidas
hechas por Heyl de la constante G gravitatoria con bolas de diferentes
materiales: oro, platino y vidrio.
Se selecciona la opcin One-Way ANOVA y se obtienen los siguientes campos:
Dependent Variable: En este campo se debe introducir la variable respuesta o
dependiente :G
Factor: Se debe introducir el nombre del factor cuya influencia se desea estudiar.
Los valores de esta variable deben reflejar los distintos grupos. As por ejemplo,
para este caso es el factor material que tomar los valores : 1=oro, 2=platino y
3=vidrio.
Select: Es un campo opcional que permite seleccionar un conjunto de
observaciones del total de ellas.
Sort: Es una instruccin que cuando est seleccionada ordena las variables del
archivo alfabticamente.
Para realizar el anlisis se seguirn los siguientes pasos:
1. Abrir el archivo de datos Heyl.sf3.
2. Seleccionar de la barra de men Compare, Analysis of Variance, One- Way
ANOVA.

3. Se introduce la variable respuesta y el factor en los campos correspondientes.


Dependent variable: G ; Factor: material
Se presiona OK. Aparecer en pantalla Analisis Summary con el nombre de la
variable respuesta, factor y nmero de observaciones.
4. Se pulsa el botn Tabular Options de la barra de herramientas. De las opciones
que permite el programa se seleccionarn:
Summary Statistics: presenta un resumen estadstico para los tres grupos del
material, pulsando el botn derecho del mouse se puede ampliar las medidas
caractersticas que nos ofrece el programa.
ANOVA table: presenta la siguiente tabla del anlisis de la varianza
Ho = u1=u2=u3
H1=Alguna diferencia existe
ANOVA Table for G by material
Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Between groups
0,000565104
2 0,000282552
26,08
0,0000
Within groups
0,000140833
13 0,0000108333
----------------------------------------------------------------------------Total (Corr.)
0,000705938
15

P_Value < alfa Se rechaza Ho.


que nos lleva a rechazar la hiptesis nula de igualdad de medias entre (between)
los tres grupos del material, y permite concluir qu tipo de material tiene un efecto
significativo (nivel crtico = p-value = 0,0000 < ).
Table of Means: presenta las medias de los grupos con las desviaciones tpicas
de stas. Con el botn derecho del mouse elija Pane Options y Confidence
Interval construye un intervalo de confianza para cada media. Se puede establecer
el nivel de confianza en la misma ventana.
Multiple Range Test: presenta varios procedimientos de comparacin de las
medias de cada tratamiento que permite decidir cuales son significativamente
distintas.

Multiple Range Tests for G by material


-------------------------------------------------------------------------------Method: 95,0 percent LSD
material
Count
Mean
Homogeneous Groups
-------------------------------------------------------------------------------2
5
6,664
X
3
5
6,674
X
1
6
6,67817
X
-------------------------------------------------------------------------------Contrast
Difference
+/- Limits
-------------------------------------------------------------------------------1 - 2
*0,0141667
0,00430572
1 - 3
0,00416667
0,00430572
2 - 3
*-0,01
0,00449718
-------------------------------------------------------------------------------* denotes a statistically significant difference.

De esta pantalla se obtienen las siguientes conclusiones: la media del grupo 2 se


puede considerar significativamente distinta de las medias del grupo 1 y 3, pero
las medias de los grupos 1 y 3 no se pueden considerar significativamente
distintas entre s. Esto se puede concluir comparando el valor de difference con el
de limits, se observa que las diferencias para las medias ente 1 y 2, y 2 y 3 son
mayores que los valores lmites con los que se comparan.
Esto tambin se ilustra por las equis (x) que aparecen en la parte superior de la
pantalla, aquellos grupos cuyas x estn alineadas no tienen diferencias
significativas entre sus medias.
Pulsando el botn derecho del mouse se selecciona Pane Options, aparecen
distintos criterios para hacer los contrastes (LSD, Bonferroni,...).
5. Pinchando el botn Graphical Options de la barra de herramientas, se obtienen
los siguientes grficos:
Scatterplot: presenta un grfico de la constante G frente al material, en el se
puede observar que el grupo correspondiente al material 2 tiene un
comportamiento distinto a los otros dos grupos.
Means Plot: presenta un grfico (intervalo) para las medias de los grupos. Se
obtienen conclusiones semejantes a las del grfico anterior.
Box and Wisher Plot: presenta los diagramas de cajas para cada grupo.
Residuals versus Factor Levels: grafica los residuos por niveles del factor.
Residual Plot for G
(X 0,001)
8

residual

5
2
-1
-4
-7
1

material

Residuals versus Predicted:

Residual Plot for G


(X 0,001)
8

residual

5
2
-1
-4
-7
6,66

6,664

6,668

6,672

6,676

6,68

predicted G

Residuals versus Row Number:


Residual Plot for G
(X 0,001)
8

residual

5
2
-1
-4
-7
0

12

16

row number

Este grfico presenta los residuos frente al orden en que han sido introducidos los
datos. Si este orden correspondiera con el orden en que estos se han tomado,
permite comprobar la hiptesis de independencia. Si no se dispone de esa
informacin este grfico no resulta de especial inters.
Para estudiar la normalidad de los residuos es necesario salvarlos, pulsando el
botn del diskette y seleccionando Residuals. Quedan como una variable adicional
en el archivo de datos en estudio. La normalidad se comprueba mediante uno de
los contrastes ya estudiados o a partir del grfico probabilista normal.
Anlisis de las hiptesis del modelo
El modelo est basado en las hiptesis de normalidad de los datos de cada grupo,
igualdad de varianzas en todos los grupos e independencia de los residuos. Todas
estas hiptesis pueden comprobarse con los grficos de residuos. Para la
hiptesis de igualdad de varianzas (de todos los grupos), existen adems los
siguientes test:
Test de homogeneidad de varianzas: Se elige Variance Check. El sistema da los
resultados de tres test de homogeneidad de varianzas. La hiptesis nula en todos
ellos es que las varianzas de los distintos niveles mayor que 0.05son iguales. Por
ello, si el p-valor de los test de Cochran o Barlett es, no se rechaza la hiptesis de
igualdad de varianzas.

Ho = Sigma1 = sigma 2 = sigma 3 = sigma 4


H1: Alguna diferencia existe
Aceptamos que los cuatro grupos tienen varianzas iguales?
Si, porque p_value > 0.05, por lo tanto, NO se puede rechazar H0.
Grficos de residuos: Pulse el botn Graphical Options. El sistema ofrece tres
opciones. Eligiendo Residual versus Factor Levels se dibujan los residuos
correspondientes a cada uno de los niveles del factor. Observar el grfico y
contestar a las siguientes cuestiones:
Tienen todos los niveles una variabilidad similar?
Se puede suponer que la distribucin de los residuos dentro de cada nivel se
aproxima a una distribucin normal de media cero?
Existe algn dato anmalo?
Las dos ltimas cuestiones se pueden contestar tambin a partir del Box and
Whisher Plot en las opciones grficas. En caso de existir algn dato anmalo, se
deber comprobar si ha habido algn error al tomar o al introducir los datos.
Entrando de nuevo en la opcin grfica elija Residuals versus Row Number: El
sistema dibuja los residuos en el orden en que estn almacenados los datos en la
variable notas.
Se observa algn tipo de dependencia entre las observaciones?
2. Ejercicio Propuesto
Se quiere estudiar hasta que punto el tipo de estrategia de diversificacin de
productos influye en los resultados de la empresa. Para ello se analiza la
rentabilidad econmica de 10 empresas elegidas al azar de cada uno de los tipos:

Negocio nico (se dedica a un solo producto)


Negocio Dominante (uno de los productos es dominante)
Diversificacin relacionada (varios productos relacionados entre si)
Diversificacin no relacionada (varios productos no relacionados)

Las rentabilidades de las 40 empresas estn recogidas en la variable


AVAR1.RENT, y los cdigos correspondientes, en la variable AVAR1.ESTRA

1. Indicar cmo debe realizarse el experimento para eliminar la influencia en


los resultados de otros factores, como el tamao de la empresa y el entorno
especifico (sector en el que esta inmersa)
2. Contrastar si la estrategia de diversificacin influye en los resultados
3. Estimar la rentabilidad media de las empresas con diversificacin
relacionada
4. Estimar las diferencias entre rentabilidades medias entre los distintos
grupos, indicando si son significativas
5. Analizar si son correctas las hiptesis del modelo
Diseo del experimento:
Para poder realizar el experimento se deben separar las empresas por el tipo
de estrategia que cada una tiene con respecto a la rentabilidad que se ocupa.
-

Cada empresa debe ser de la misma regin para poder ser estudiada
La empresa debe ser de las categoras de microempresas
Las empresas deben tener iguales tiempos de vigencias
Deben pertenecer al mismo rubro
Deben tener similar estrategia
Cantidad misma de trabajadores
Calidad de productos similares

Contraste de igualdad de medias. Plantear la hiptesis del contraste:


Ho= U1 = U2 =U3 = U4
H1= Diferencias existentes entre si
Se rechaza la hiptesis nula?
Se rechaza la hiptesis nula puesto que el valor-P de la prueba-F es menor que 0,05, existe una diferencia estadsticamente
significativa entre las medias de las 4 variables con un nivel del 95,0% de confianza

Con que grado de evidencia?

Qu se puede concluir sobre la influencia de la estrategia de diversificacin de


productos en los resultados de la empresa?.
Intervalos de confianza
Para las empresas con diversificacin relacionada, completar.

Rentabilidad media =

Intervalo de confianza al 95% =

Comparacin de medias
Qu intervalos contienen el cero?
Qu diferencias son estadsticamente significativas?
Explicar las conclusiones que se obtienen sobre la influencia positiva o negativa
de las distintas estrategias de diversificacin de productos en la rentabilidad de la
empresa
Anlisis de la hiptesis del modelo
El modelo est basado en las hiptesis de normalidad de los datos de cada grupo,
igualdad de varianzas en todos los grupos e independencia de los residuos.
a) Test de homogeneidad de varianzas
Aceptamos que las cuatro estrategias tienen varianzas iguales?
b) Grficos de residuos
Tienen todos los niveles una variabilidad similar?
Se puede esperar que la distribucin de los residuos dentro de cada nivel
se aproxime a una distribucin normal de media cero?
Existe algn dato anmalo?
Se observa algn tipo de dependencia entre las observaciones?

Potrebbero piacerti anche