Sei sulla pagina 1di 75

ANOVA para ms de un factor

Pablo A. Salgado email: psalgado@estadisticaaplicada.com.ar psalgado@fibertel.com.ar

En el apartado anterior se han visto los procedimientos que permiten la comparacin de medias (ANOVA de un factor), que permite contrastar la hiptesis de igualdad de medias de las poblaciones definidas por los diferentes niveles en que poda segmentar el factor o variable independiente. Cuando se desea estudiar el efecto de ms de un factor sobre la variable dependiente es preciso recurrir a los modelos factoriales de anlisis de varianza que permiten estudiar el efecto de diversos factores, tanto de manera individual como conjunta.
2

Cuando se trabaja con un factor (VI), se estudia su efecto sobre la VD y se especifican diversos contrastes entre los niveles del factor, si el resultado del ANOVA es significativo. Pero si en el estudio intervienen dos factores, hay tres efectos que deben considerarse: los efectos de cada factor por separado sobre la VD, que se conocen como efectos principales, y el efecto de la interaccin de ambos factores sobre la VD
3

Dadas una variable dependiente cuantitativa y dos o mas variables independientes cualitativas, o factores, el anlisis factorial de la varianza consiste en analizar el comportamiento de la variable dependiente en las K subpoblanciones o grupos establecidos por las combinaciones de los valores de las independientes.
4

En el caso de tres factores, los efectos a estudiar seran 7 (tres principales, 3 interacciones dobles y 1 interaccin triple). Si el nmero de factores fueran cuatro, los efectos a estudiar seran 15 (4 principales, 6 interacciones binarias, 4 interacciones triples, y 1 interaccin cudruple).
5

El diseo factorial completamente aleatorizado


En este diseo se exploran los efectos que cada factor tiene sobre la VD y los efectos de la interaccin. La hiptesis nula para cada factor dice que las medias de las poblaciones definidas por los grupos o niveles del factor son iguales. La hiptesis referidas a las interacciones afirman que stas no existen. Para el contraste de estas hiptesis se utiliza el estadstico F, y segn sea su valor crtico se aceptar o no la hiptesis planteada.
6

Cuando hay ms de un factor, el nmero de poblaciones involucradas sern tantas como el producto de los niveles de cada uno de los factores. Ejemplo: ser realiza el anlisis de varianza factorial con dos factores, el primer con 3 niveles, y el segundo con 4 niveles, el nmero total de poblaciones ser 12 (3 x 4 = 12). Estas 12 poblaciones deben ser normales y homocedsticas.
7

Tambin supone el modelo que las observaciones han sido aleatoriamente seleccionadas, una muestra de cada poblacin. Por lo tanto estas poblaciones son independientes entre si.

Ejemplo:
archivos: ANOVA ULCERA.sav y ANOVA ULCERA.xls

Supongamos que se sospecha que en los pacientes con lcera pptica que han seguido un tratamiento, el tiempo que tarda en reaparecer la sintomatologa ulcerosa est relacionado con el tiempo que tarda el paciente en responder al tratamiento.
9

Se somete al tratamiento a un grupo de pacientes con lcera pptica, siendo todos ellos fumadores, y peridicamente (cada dos semanas) se comprueba si la sintomatologa ulcerosa persiste o ha desaparecido. Una vez desaparecida, el paciente sigue sometido a revisiones mensuales para comprobar el tiempo que tarda en reaparecer.
10

Antes de comenzar el tratamiento, algunos de los pacientes han decidido abandonar el hbito de fumar, por lo que se sospecha que en la reaparicin de los sntomas, adems del tiempo de respuesta al tratamiento, puede influir el efecto del abandono del tabaco. Por lo tanto se aplicar el ANOVA de dos factores.
11

Si denominamos RESPUEST y TABACO a las variables Tiempo de respuesta al tratamiento y Tabaquismo respectivamente, los valores que presenta la primera en el conjunto de pacientes observados son: 2, 4, 6 y 8 semanas. Los valores que presenta la segunda variable son Si y No.
12

La hiptesis nula que se desea contrastar es que las ocho muestras, establecidas por las combinaciones de los valores de RESPUEST y TABACO, proceden de ocho subpoblaciones en las que las medias de REAPARIC son iguales:
13

H0: respuesta1, tabaco1 = respuesta1, tabaco2 = respuesta2, tabaco1 = respuesta2, tabaco2 = respuesta3, tabaco1 = respuesta3, tabaco2 = respuesta4, tabaco1 = respuesta4, tabaco2

14

Tabla de anlisis de la varianza:

El anlisis de la varianza con q factores se basa en que la variabilidad total de la muestra puede descomponerse en la variabilidad debida a, o explicada por, las diferencias entre grupos y la debida a las diferencias dentro de los grupos o residual: SC Total = SC Entre + SC Residual
15

A su vez, la variabilidad explicada por el efecto de pertenecer a un grupo puede descomponerse en la variabilidad debida a los efectos de cada una de las q variables independientes (efectos principales) y la debida al efecto de todas las posibles interacciones entre ellas.
16

ANALIZAR -> MODELO LINEAR GENERAL -> UNIVARIANTE En el cuadro de dilogo DEPENDIENTES: LNREAPAR FACTORES FIJOS:
Tiempo de respuesta Paciente que ha dejado de fumar

MODELO En el cuadro de dilogo SUMA DE CUADRADOS: TIPO II CONTINUAR OPCIONES En el cuadro de dilogo
MOSTRAR: ESTADISTICOS DESCRIPTIVOS CONTINUAR

ACEPTAR
17

Anlisis de varianza univariante


Factores inter-sujetos Etiqueta del valor 1 Tiempo de respuesta 2 3 4 Paciente ha dejado de fumar 1 2 2 Semanas 4 Semanas 6 Semanas 8 Semanas Si No N 112 100 73 27 153 159

18

Estadsticos descriptivos: Variable dependiente: LNREAPAR Tiempo de respuesta Paciente ha dejado de fumar Si 2 Semanas No Total Si 4 Semanas No Total Si 6 Semanas No Total Si 8 Semanas No Total Si Total No Total Media 2,4814 2,0963 2,3336 2,2051 1,7987 1,9613 1,5745 1,8828 1,7223 1,0310 1,4551 1,3609 2,1271 1,8523 1,9870 Desv. tp. ,12859 ,16019 ,23503 ,10899 ,27325 ,29872 ,20169 ,18988 ,24898 ,16553 ,21894 ,27281 ,45124 ,29495 ,40329 N 69 43 112 40 60 100 38 35 73 6 21 27 153 159 312
19

Pruebas de los efectos inter-sujetos Variable dependiente: LNREAPAR Fuente Modelo corregido Interseccin RESPUEST TABACO RESPUEST * TABACO Error Suma de cuadrados tipo II 39,683(a) 1231,879 25,413 2,082 8,384 10,897 gl 7 1 3 1 3 304 Media cuadrtica 5,669 8,471 2,082 2,795 3,585E-02 F 158,147 236,313 58,086 77,966 Significacin ,000 ,000 ,000 ,000 ,000

1231,879 34365,134

Total

1282,460

312

Total corregida

50,581

311

a R cuadrado = ,785 (R cuadrado corregida = ,780)

20

El p-valor asociado al estadstico F, en la lnea Modelo Corregido, es menor que 0,05. Por lo tanto se rechaza la hiptesis nula de que las ocho medidas son iguales. Dado que las diferencias entre lo observado en la muestra y lo esperado bajo la hiptesis nula de igualdad de las medias son estadsticamente significativas, no se puede aceptar que el tiempo de reaparicin de los sntomas sea el mismo considerando simultneamente los distintos tiempos de respuesta al tratamiento y si el paciente ha dejado de fumar o no.
21

Sin embargo, mediante el anlisis de la varianza con un factor, habamos comprobado que el tiempo de reaparicin de los sntomas era distinto segn el tiempo de respuesta al tratamiento.
22

Podra suceder entonces que la diferencia de medias fuera debida nicamente al efecto de la variable RESPUEST, sin que el de TABACO interviniera en el resultado. Habiendo solo 4 medias distintas correspondientes a los cuatro grupos establecidos por los valores de RESPUEST:
23

respuesta1 = respuesta1, tabaco1 = respuesta1, tabaco2 respuesta2 = respuesta2, tabaco1 = respuesta2, tabaco2 respuesta3 = respuesta3, tabaco1 = respuesta3, tabaco2 respuesta4 = respuesta4, tabaco1 = respuesta4, tabaco2

siendo respuesta i distintas entre si.

24

Para comprobar a qu es debido este hecho de que se rechace la hiptesis nula de igualdad de las ocho medias, analizaremos: el efecto de cada factor por separado el efecto de la interaccin.
25

Anlisis de la interaccin entre los factores:


Al contrastar la hiptesis nula de que el efecto de la interaccin de orden 2 es igual a cero, el p-valor asociado al estadstico F es menor que 0,05 (RESPUEST*TABACO).
26

Al contrastar la hiptesis nula de que, en particular, el efecto de cada uno de los factores RESPUEST y TABACO es nulo, tambin los pvalores asociados a los estadsticos F correspondientes, son significativos.
27

En consecuencia, al nivel de significacin 0,05 todas las posibles hiptesis relativas a la nulidad de efectos pueden ser rechazadas. Luego el que las ocho medias difieran es debido tanto al efecto que causa una de las variables RESPUEST y TABACO por separado como al efecto de su interaccin. Ilustremos grficamente este resultado:
28

GRAFICOS -> LINEAS MULTIPLE -> DEFINIR

En el cuadro de dilogo En el cuadro de dilogo

EJE DE CATEGORIAS: Tiempo de respuesta DEFINIR LINEAS POR: Pacientes ha dejado de fumar LAS LINEAS REPRESENTAN: OTRA FUCION DE RESUMEN VARIABLE: MEAN (LNREAPAR) ACEPTAR

29

30

14

12

95% IC Tiempo de reaparicin

10

6 Fuma 4 Si

0 2 Sem 4 Sem 6 Sem 8 Sem

No

Tiempo de respuesta

31

Representacin grfica de las medias de LNREAPAR en los grupos establecidos por las combinaciones de los valores de las variables RESPUEST y TABACO.
32

18 16 14

Tiempo de reaparicin

12 10 8 6 4 Fuma 2 0 2 Sem 4 Sem 6 Sem 8 Sem


Si No

Tiempo de respuesta

33

CONCLUSIONES
A partir de los resultados anteriores podemos concluir que, para predecir el tiempo de reaparicin de los sntomas, es adecuado distinguir segn el tiempo de respuesta al tratamiento y segn si el paciente ha dejado de fumar o no.
34

Ejemplo ANOVA
Archivos: Datos de empleados fin.sav Datos de empleados fin.xls

Pablo A. Salgado email: psalgado@estadisticaaplicada.com.ar psalgado@fibertel.com.ar

Variables:
Sexo Edad (aos) Edad (agrupada) Nivel educativo (aos) Nivel educativo (niveles) Categora laboral Salario actual Salario inicial Meses desde el contrato Experiencia previa (meses) Situacin social (minora/mayora)
36

ANOVA de un factor:
Categoras laboral (VI) vs. Salario actual (VD).
Salario actual Descriptivos Intervalo de confianza para la media al 95% Lmite superior Lmite inferior $27,057.40 $28,619.68 $30,102.37 $31,775.40 $60,018.44 $67,937.16 $32,878.40 $35,960.73

N Administrativo Seguridad Directivo Total 363 27 84 474

Media $27,838.54 $30,938.89 $63,977.80 $34,419.57

Desviacin tpica $7,567.995 $2,114.616 $18,244.776 $17,075.661

Error tpico $397.217 $406.958 $1,990.668 $784.311

Mnimo $15,750 $24,300 $34,410 $15,750

Mximo $80,000 $35,250 $135,000 $135,000

Prueba de homogeneidad de varianzas Salario actual Estadstico de Levene 59,733 gl1 2 gl2 471 Sig. ,000

37

ANOVA de un factor:
Categoras laboral vs. Salario actual.
ANOVA Salario actual Suma de cuadrados 89438483925,943 48478011510,397 137916495436,340 gl 2 471 473 Media cuadrtica 44719241963,0 102925714,459 F 434,481 Sig. ,000

Inter-grupos Intra-grupos Total

Pruebas robustas de igualdad de las medias Salario actual Welch Brown-Forsythe Estadstico 162,200 306,810
a

gl1 2 2

gl2 117,312 93,906

Sig. ,000 ,000

a. Distribuidos en F asintticamente.

38

Grfico de medias
70000 60000

50000

Media de Salario actual

40000

30000

20000 Administrativo Seguridad Directivo

Categora laboral
39

Box Plot: Salario actual y Categora laboral

40

Comparacin Post hoc : Scheff y Games Howell


Comparaciones mltiples Variable dependiente: Salario actual Intervalo de confianza al 95% Lmite superior Lmite inferior -$8,069.80 $1,869.10 -$39,155.54 -$33,122.98 -$1,869.10 $8,069.80 -$38,550.17 -$27,527.65 $33,122.98 $39,155.54 $27,527.65 $38,550.17 -$4,454.82 -$1,745.88 -$40,977.01 -$31,301.51 $1,745.88 $4,454.82 -$37,881.37 -$28,196.45 $31,301.51 $40,977.01 $28,196.45 $37,881.37

Scheff

(I) Categora laboral Administrativo Seguridad Directivo

Games-Howell

Administrativo Seguridad Directivo

(J) Categora laboral Seguridad Directivo Administrativo Directivo Administrativo Seguridad Seguridad Directivo Administrativo Directivo Administrativo Seguridad

Diferencia de medias (I-J) -$3,100.349 -$36,139.258* $3,100.349 -$33,038.909* $36,139.258* $33,038.909* -$3,100.349* -$36,139.258* $3,100.349* -$33,038.909* $36,139.258* $33,038.909*

Error tpico $2,023.760 $1,228.352 $2,023.760 $2,244.409 $1,228.352 $2,244.409 $568.679 $2,029.912 $568.679 $2,031.840 $2,029.912 $2,031.840

Sig. ,310 ,000 ,310 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000

*. La diferencia de medias es significativa al nivel .05.

41

Subconjuntos Homogeneos:
Scheff
Salario actual Subconjunto para alfa = . 05 1 2 $27,838.54 $30,938.89 $63,977.80 ,259 1,000

Scheffa,b

Categora laboral Administrativo Seguridad Directivo Sig.

N 363 27 84

Se muestran las medias para los grupos en los subconjuntos homogneos. a. Usa el tamao muestral de la media armnica = 58,031. b. Los tamaos de los grupos no son iguales. Se utilizar la media armnica de los tamaos de los grupos. Los niveles de error de tipo I no estn garantizados.

42

Comparaciones planeadas a priori


Grupo de edades (VI) Salario actual (VD)

Pablo A. Salgado email: psalgado@estadisticaaplicada.com.ar psalgado@fibertel.com.ar

Grupo de Edades vs. Salario actual


Salario actual

Descriptivos
Intervalo de confianza para la media al 95% Lmite Lmite inferior superior $27,184.22 $30,797.25 $37,640.62 $42,888.60 $38,156.27 $54,561.23 $36,133.91 $51,884.27 $25,331.23 $30,513.47 $32,874.01 $35,962.88

Menos de 25 aos Entre 25 y 30 aos Entre 30 y 35 aos Entre 35 y 40 aos Ms de 40 aos Total

N 129 141 36 33 134 473

Media $28,990.74 $40,264.61 $46,358.75 $44,009.09 $27,922.35 $34,418.45

Desviacin tpica $10,369.639 $15,759.889 $24,242.481 $22,209.593 $15,164.298 $17,093.723

Error tpico $912.996 $1,327.222 $4,040.414 $3,866.194 $1,309.996 $785.970

Mnimo $18,150 $21,900 $20,850 $22,050 $15,750 $15,750

Mximo $90,625 $91,250 $103,750 $110,625 $135,000 $135,000

Prueba de homogeneidad de varianzas Salario actual Estadstico de Levene 18,491 gl1 4 gl2 468 Sig. ,000

Pruebas robustas de igualdad de las medias Salario actual Welch Brown-Forsythe Estadstico 20,048 15,813
a

gl1 4 4

gl2 118,544 130,174

Sig. ,000 ,000

a. Distribuidos en F asintticamente.
44

Comparaciones mltiples Variable dependiente: Salario actual Scheff Intervalo de confianza al 95% Lmite Lmite inferior superior -$17,192.43 -$5,355.31 -$26,524.62 -$8,211.41 -$24,494.77 -$5,541.93 -$4,923.58 $7,060.35 $5,355.31 $17,192.43 -$15,165.33 $2,977.05 -$13,138.40 $5,649.44 $6,481.65 $18,202.87 $8,211.41 $26,524.62 -$2,977.05 $15,165.33 -$9,357.59 $14,056.91 $9,317.14 $27,555.66 $5,541.93 $24,494.77 -$5,649.44 $13,138.40 -$14,056.91 $9,357.59 $6,646.40 $25,527.08 -$7,060.35 $4,923.58 -$18,202.87 -$6,481.65 -$27,555.66 -$9,317.14 -$25,527.08 -$6,646.40

(I) Grupo de edades Menos de 25 aos

Entre 25 y 30 aos

Entre 30 y 35 aos

Entre 35 y 40 aos

Ms de 40 aos

(J) Grupo de edades Entre 25 y 30 aos Entre 30 y 35 aos Entre 35 y 40 aos Ms de 40 aos Menos de 25 aos Entre 30 y 35 aos Entre 35 y 40 aos Ms de 40 aos Menos de 25 aos Entre 25 y 30 aos Entre 35 y 40 aos Ms de 40 aos Menos de 25 aos Entre 25 y 30 aos Entre 30 y 35 aos Ms de 40 aos Menos de 25 aos Entre 25 y 30 aos Entre 30 y 35 aos Entre 35 y 40 aos

Diferencia de medias (I-J) -$11,273.873* -$17,368.014* -$15,018.354* $1,068.386 $11,273.873* -$6,094.140 -$3,744.481 $12,342.259* $17,368.014* $6,094.140 $2,349.659 $18,436.399* $15,018.354* $3,744.481 -$2,349.659 $16,086.740* -$1,068.386 -$12,342.259* -$18,436.399* -$16,086.740*

Error tpico $1,913.802 $2,960.844 $3,064.258 $1,937.538 $1,913.802 $2,933.225 $3,037.580 $1,895.064 $2,960.844 $2,933.225 $3,785.610 $2,948.767 $3,064.258 $3,037.580 $3,785.610 $3,052.590 $1,937.538 $1,895.064 $2,948.767 $3,052.590

Sig. ,000 ,000 ,000 ,990 ,000 ,366 ,823 ,000 ,000 ,366 ,984 ,000 ,000 ,823 ,984 ,000 ,990 ,000 ,000 ,000

*. La diferencia de medias es significativa al nivel .05.


45

Subconjuntos Homogeneos
Salario actual Scheff
a,b

Grupo de edades Ms de 40 aos Menos de 25 aos Entre 25 y 30 aos Entre 35 y 40 aos Entre 30 y 35 aos Sig.

N 134 129 141 33 36

Subconjunto para alfa = . 05 1 2 $27,922.35 $28,990.74 $40,264.61 $44,009.09 $46,358.75 ,998 ,323

Se muestran las medias para los grupos en los subconjuntos homogneos. a. Usa el tamao muestral de la media armnica = 62,199. b. Los tamaos de los grupos no son iguales. Se utilizar la media armnica de los tamaos de los grupos. Los niveles de error de tipo I no estn garantizados.

46

Comparaciones mltiples Variable dependiente: Salario actual Games-Howell Intervalo de confianza al 95% Lmite superior Lmite inferior -$15,701.15 -$6,846.60 -$29,218.08 -$5,517.95 -$26,428.75 -$3,607.96 -$3,321.12 $5,457.89 $6,846.60 $15,701.15 -$18,203.42 $6,015.14 -$15,421.11 $7,932.15 $7,221.24 $17,463.28 $5,517.95 $29,218.08 -$6,015.14 $18,203.42 -$13,327.73 $18,027.05 $6,339.70 $30,533.10 $3,607.96 $26,428.75 -$7,932.15 $15,421.11 -$18,027.05 $13,327.73 $4,423.04 $27,750.44 -$5,457.89 $3,321.12 -$17,463.28 -$7,221.24 -$30,533.10 -$6,339.70 -$27,750.44 -$4,423.04

(I) Grupo de edades Menos de 25 aos

Entre 25 y 30 aos

Entre 30 y 35 aos

Entre 35 y 40 aos

Ms de 40 aos

(J) Grupo de edades Entre 25 y 30 aos Entre 30 y 35 aos Entre 35 y 40 aos Ms de 40 aos Menos de 25 aos Entre 30 y 35 aos Entre 35 y 40 aos Ms de 40 aos Menos de 25 aos Entre 25 y 30 aos Entre 35 y 40 aos Ms de 40 aos Menos de 25 aos Entre 25 y 30 aos Entre 30 y 35 aos Ms de 40 aos Menos de 25 aos Entre 25 y 30 aos Entre 30 y 35 aos Entre 35 y 40 aos

Diferencia de medias (I-J) -$11,273.873* -$17,368.014* -$15,018.354* $1,068.386 $11,273.873* -$6,094.140 -$3,744.481 $12,342.259* $17,368.014* $6,094.140 $2,349.659 $18,436.399* $15,018.354* $3,744.481 -$2,349.659 $16,086.740* -$1,068.386 -$12,342.259* -$18,436.399* -$16,086.740*

Error tpico $1,610.925 $4,142.282 $3,972.533 $1,596.762 $1,610.925 $4,252.818 $4,087.661 $1,864.834 $4,142.282 $4,252.818 $5,592.173 $4,247.473 $3,972.533 $4,087.661 $5,592.173 $4,082.100 $1,596.762 $1,864.834 $4,247.473 $4,082.100

Sig. ,000 ,001 ,005 ,963 ,000 ,610 ,889 ,000 ,001 ,610 ,993 ,001 ,005 ,889 ,993 ,003 ,963 ,000 ,001 ,003

*. La diferencia de medias es significativa al nivel .05.

47

48

49

Coeficientes de los contrastes Grupo de edades Entre 25 y Entre 30 y Entre 35 y 30 aos 35 aos 40 aos 1 0 -1 -2 -2 -2

Contraste 1 2

Menos de 25 aos 1 3

Ms de 40 aos -1 3

Pruebas para los contrastes Valor del contraste -$2,676.10 -$90,525.64 -$2,676.10 -$90,525.64

Salario actual

Asumiendo igualdad de varianzas No asumiendo igualdad de varianzas

Contraste 1 2 1 2

Error tpico $3,602.908 $9,905.028 $4,388.465 $12453.21

t -,743 -9,139 -,610 -7,269

gl 468 468 52,745 101,853

Sig. (bilateral) ,458 ,000 ,545 ,000

50

ANOVA para Medidas Repetidas


Pablo A. Salgado email: psalgado@estadisticaaplicada.com.ar psalgado@fibertel.com.ar

Hemos visto, dentro del modelo lineal general, lo que en el mbito del diseo se denominan diseos factoriales completamente aleatorizados, en donde se asigna aleatoriamente a los sujetos a cada una de las condiciones experimentales que se deriven del nmero de factores que concurren en el diseo. En este caso las fuentes de variabilidad del anlisis representan las diferencias entre los sujetos sometidos a las distintas condiciones.
52

En contraste con esto, hay otro tipo de diseos, en los que los sujetos pueden servir en todas o en algunas de las condiciones o tratamientos. En estas circunstancias, parte de la variabilidad extrada en el anlisis ser el reflejo de la variabilidad de cada sujeto, y esta es la razn por la cual a este tipo de diseos se les denomina diseos intra-sujetos o diseos de medidas repetidas.
53

Los modelos de ANOVA con medidas repetidas (MR) sirven para estudiar el efecto de uno o mas factor intra-sujetos y se caracteriza porque todos los los neviveles del factor (si hay mas de uno) se aplican a los mismos sujetos. El diseo mas simple de MR consiste en medir dos variables en una misma muestra de sujetos. Los datos de este diseo, como vimos, se analizan con la prueba t de Student para muestras relacionadas.
54

Pero los diseos de MR pueden tener mas de dos medidas y mas de un factor. Las ventajas del diseo de MR son que requiere menos sujetos que un diseo aletorizado y permite eliminar la variacin residual debida a las diferencias entre sujetos ya que son los mismos. Pero hay que analizar algunos efectos atribuibles a la utilizacin de los mismos sujetos, tales como efectos de arrastre (analizar un efecto sin esperar que finalice el efecto tomado anteriormente) o de aprendizaje entre las series (mejora con la repeticin).
55

En las ciencias del comportamiento, una alta proporcin de los diseos que se llevan a cabo son de este tipo por la ventajas que suponen. Son diseos que permiten estudiar cambios en conductas tales como aprendizaje, entrenamiento, recuerdo, cambio de actitudes, etc. Adems son particularmente sensibles y eficientes, en el sentido de que son ms econmicos en cuanto al nmero de sujetos, en comparacin con los diseos entre-sujetos.
56

Diseo de un factor con medidas repetidas


Archivos: lectura medidas repetidas.sav lectura medidas repetidas.xls

Pablo A. Salgado email: psalgado@estadisticaaplicada.com.ar psalgado@fibertel.com.ar

Diseo de un factor intra-sujetos


Es el caso ms simple: Un grupo de sujetos pasa por todas las condiciones o niveles de un nico factor. Para llevar a cabo el anlisis vamos a utilizar un conjunto de datos basados en un experimento de atencin, en el cual, a cada sujeto, se le dan cinco pginas impresas, asignadas en sentido aleatorio. Cada pgina tienen un nivel de dificultad de lectura ascendente (menos difcil el nivel 1 y ms difcil el nivel 4) y cada una contiene el mismo nmero de errores tipogrficos.
58

Los sujetos tenan que localizar los errores y la VD es el nmero de errores identificados correctamente.
Sujetos 1 2 3 4 5 6 7 8 9 n1 14 15 16 13 16 16 14 12 11 n2 12 10 8 11 12 10 13 8 8 n3 7 9 11 8 7 8 12 11 8 n4 6 9 9 9 12 11 10 7 10

59

Sintaxis
GLM n1 n2 n3 n4 /WSFACTOR = factor1 4 Polynomial /METHOD = SSTYPE(3) /PLOT = PROFILE( factor1 ) /EMMEANS = TABLES(factor1) COMPARE ADJ(BONFERRONI) /PRINT = OPOWER /CRITERIA = ALPHA(.05) /WSDESIGN = factor1 .

60

Factores intra-sujetos Medida: MEASURE_1 factor1 1 2 3 4 Variable dependiente n1 n2 n3 n4

c Contrastes multivariados

Efecto factor1

Traza de Pillai Lambda de Wilks Traza de Hotelling Raz mayor de Roy

Valor ,898 ,102 8,791 8,791

F 17,582b 17,582b 17,582b 17,582b

Gl de la hiptesis 3,000 3,000 3,000 3,000

Gl del error 6,000 6,000 6,000 6,000

Significacin ,002 ,002 ,002 ,002

Parmetro de no centralidad 52,747 52,747 52,747 52,747

Potencia a observada ,994 ,994 ,994 ,994

a. Calculado con alfa = ,05 b. Estadstico exacto c. Diseo: Interseccin Diseo intra sujetos: factor1

61

La primera tabla es la de los contrastes multivariados, que ofrece cuatro estadsticos: la Traza de Pillai, la Lamdba de Wilks, la Traza de Hotelling y la Raz mayor de Roy. Su interpretacin es la misma que la de cualquier estadstico: si el nivel crtico es < 0,05 se rechaza la hiptesis de igualdad de medias de los tratamientos. En nuestro caso, efectivamente, se puede decir que el nmero de errores tipogrficos detectados depende del nivel de dificultad de lectura de la pgina.
62

En los modelos de medidas repetidas es necesario trabajar con el supuesto de que las varianzas de las diferencias entre cada dos niveles del factor MR son iguales. En este ejemplo (4 medidas) pueden hacerse 6 pares de combinaciones de a dos por cada nivel (1-2, 1-3, 1-4, 2-3, 2-4, 3-4).
63

En el modelo de un factor MR se asume que las varianzas de esas 6 variables son iguales. Este supuesto equivale a a afirmar que la matriz de varianzas-covarianzas es circularo esfrica (circularidad de la matriz de varianzas-covarianzas). El procedimiento de MR ofrece para contrastarlo la prueba de esfericidad de Mauchly.
64

Para contrastar el supuesto, el procedimiento Medidas repetidas aporta la prueba de esfericidad W de Mauchly, que para los datos que se analizan nos lleva a aceptar dicha hiptesis, que indica igualdad en las varianzas.
b Prueba de esfericidad de Mauchly

Medida: MEASURE_1 Epsilon Efecto intra-sujetos factor1 W de Mauchly ,819 Chi-cuadrado aprox. 1,344 gl 5 Significacin ,931 Greenhous e-Geisser ,885
a

Huynh-Feldt 1,000

Lmite-inferior ,333

Contrasta la hiptesis nula de que la matriz de covarianza error de las variables dependientes transformadas es proporcional a una matriz identidad. a. Puede usarse para corregir los grados de libertad en las pruebas de significacin promediadas. Las pruebas corregidas se muestran en la tabla Pruebas de los efectos inter-sujetos. b. Diseo: Interseccin Diseo intra sujetos: factor1

65

Pruebas de efectos intra-sujetos. Medida: MEASURE_1 Suma de cuadrados tipo III 152,306 152,306 152,306 152,306 77,944 77,944 77,944 77,944 Media cuadrtica 50,769 57,342 50,769 152,306 3,248 3,668 3,248 9,743 Parmetro de no centralidad 46,897 41,520 46,897 15,632 Potencia a observada 1,000 1,000 1,000 ,932

Fuente factor1

gl 3 2,656 3,000 1,000 24 21,249 24,000 8,000

Error(factor1)

Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior

F 15,632 15,632 15,632 15,632

Significacin ,000 ,000 ,000 ,004

a. Calculado con alfa = ,05

Si se rechaza el estadstico W: se ofrecen dos soluciones alternativas. La primera es basar la decisin en los contrastes multivariados, que no estn afectados por el incumplimiento de dicho supuesto. La segunda es utilizar el estadstico F univariado aplicando un factor de correccin denominado psilon el cual expresa el grado en que la matriz de varianzas-covarianzas se aleja de la esfericidad. Son dos las estimaciones de psilon: la de Greenhouse-Geisser y la Huynh-Feldt El tercer valor ofrecido, Lmite inferior, es el valor ms extremo que alcanzara psilon en el caso de un incumplimiento mximo de la esfericidad.
66

Respecto de los contrastes, el procedimiento ofrece por defecto contrastes de tipo Polinmico, que permite analizar la tendencia de los datos (lineal, cuadrtica, cbica, etc.). Si no se modifica esta opcin por defecto la tabla con los contrastes Polinmicos y se denomina Prueba de los contrastes intra-sujetos.
Pruebas de contrastes intra-sujetos Medida: MEASURE_1 Suma de cuadrados tipo III 113,606 38,028 ,672 18,944 26,722 32,278 Media cuadrtica 113,606 38,028 ,672 2,368 3,340 4,035 Parmetro de no centralidad 47,974 11,385 ,167 Potencia a observada 1,000 ,839 ,065

Fuente factor1

Error(factor1)

factor1 Lineal Cuadrtico Cbico Lineal Cuadrtico Cbico

gl 1 1 1 8 8 8

F 47,974 11,385 ,167

Significacin ,000 ,010 ,694

a. Calculado con alfa = ,05

67

Los resultados de esta prueba nos indica que el mejor contraste que diferencia las 4 medidas es el contraste lineal y cuadrtico. Esto significa que las medidas de los errores de tipogrfico a medida que aumenta la dificultad en la lectura se ajustan significativamente a una recta (comportamiento lineal) como a una curva (comportamiento cuadrtico).
68

La tabla siguiente permite obtener el promedio estimado para cada nivel medido con su intervalo de confianza.
factor1 Medida: MEASURE_1 Intervalo de confianza al 95%. Lmite Lmite inferior superior 12,702 15,520 8,745 11,700 7,562 10,438 7,796 10,649
69

factor1 1 2 3 4

Media 14,111 10,222 9,000 9,222

Error tp. ,611 ,641 ,624 ,619

Comparaciones por pares Medida: MEASURE_1 Intervalo de confianza al 95 a % para la diferencia Lmite Lmite inferior superior 1,332 6,446 1,965 8,257 2,538 7,240 -6,446 -1,332 -2,197 4,642 -1,840 3,840 -8,257 -1,965 -4,642 2,197 -3,491 3,046 -7,240 -2,538 -3,840 1,840 -3,046 3,491

(I) factor1 1

(J) factor1 2 3 4 1 3 4 1 2 4 1 2 3

Diferencia entre medias (I-J) 3,889* 5,111* 4,889* -3,889* 1,222 1,000 -5,111* -1,222 -,222 -4,889* -1,000 ,222

Error tp. ,735 ,904 ,676 ,735 ,983 ,816 ,904 ,983 ,940 ,676 ,816 ,940

Significacin ,004 ,003 ,001 ,004 1,000 1,000 ,003 1,000 1,000 ,001 1,000 1,000

Basadas en las medias marginales estimadas. *. La diferencia de las medias es significativa al nivel ,05. a. Ajuste para comparaciones mltiples: Bonferroni.
70

Por ultimo se comparan de a pares las 4 medidas para determinar en cuales se encuentran diferencias estadsticamente significativas. Se observa que el factor 1 se diferencia de los niveles 2, 3 y 4; pero entre los niveles 2 3 y 4 no se observan diferencias estadisticamente significativas.

71

72

73

Por ultimo se comparan de a pares las 4 medidas para determinar en cuales se encuentran diferencias estadsticamente significativas. Se observa que el factor 1 se diferencia de los niveles 2, 3 y 4; pero entre los niveles 2 3 y 4 no se observan diferencias estadisticamente significativas.

74

CONCLUSIONES
A medida que aumenta la complejidad de la la lectura disminuyen los errores detectados. La diferencia se da entre el nivel 1 y los dems niveles. No se observan diferencias en los errores entre los niveles de complejidad 2,3 y 4.
75

Potrebbero piacerti anche