Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
d = (ME MC) / DP
Onde:
d a magnitude do efeito;
M E o valor mdio observado no grupo
experimental;
MC o valor mdio observado no grupo de
controlo;
DP uma medida de variabilidade, um desvio-padro.
Deste modo, a magnitude do efeito, tipo d,
uma medida da diferena entre mdias em termos de unidades de desvio-padro. Mas qual a
medida de variabilidade a utilizar? De facto, h
vrias possibilidades: podemos usar o desvio-padro do grupo de controlo, o do grupo experimental, ou ainda alguma combinao dos dois.
Para alm disso, nos clculos, podemos optar por
utilizar o desvio-padro da amostra observada
(com N no denominador) ou a estimativa do desvio-padro da populao, e (com N1 no denominador).
Nesta questo h essencialmente trs posies. Segundo Glass (1976; 2000; Glass, &
Hopkins, 1996; Glass, McGaw, & Smith, 1981;
Smith & Glass, 1977) deve-se usar a estimativa
no-enviesada do desvio-padro da populao do
grupo de controlo. Ento o valor a atribuir ao DP
da frmula (1) seria:
(2)
ec
= [(xi Mc)2 / N1 ]
Onde:
ec a estimativa no-enviesada do desviopadro da populao da qual foi retirada a amostra do grupo de controlo;
xi o valor observado do indivduo i no grupo
de controlo;
MC o valor mdio observado no grupo de
controlo;
N o nmero de elementos no grupo de controlo.
Embora se pressuponha que, em princpio,
existe uma homogeneidade da varincia entre os
dois grupos (experimental e de controlo) aleatoriamente seleccionados da mesma populao,
Glass indica que a interveno experimental pode alterar no s a tendncia central da varivel
dependente no grupo experimental, mas tambm
a sua variabilidade (Glass, McGaw, & Smith,
1981).
Numa posio contrria, Cohen (1988) defende que a melhor estimativa do desvio-padro da
populao encontra-se na variabilidade combinada dos dois grupos, ew (desvio-padro pooled
within groups) dado por:
(3)
ew
= ((eE2 + eC2) / 2 )
Onde:
ew a estimativa no enviesada do desvio-padro da populao pooled within groups;
2
2
eE e eC so as estimativas no-enviesadas
da varincia populacional nos grupos experimental e de controlo (i.e. com N1 no denominador).
Hedges (1981; Hedges & Olkin, 1985) concorda com a posio de Cohen que o termo da
padronizao dever incluir informao no s
do grupo de controlo mas tambm do grupo experimental. Contudo, argumenta que o uso da estimativa no-enviesada da variabilidade da populao inflaciona indevidamente a magnitude
de efeito observada. Assim recomenda que no
denominador da frmula (1) se deve utilizar S w,
ou seja, o desvio-padro pooled within groups :
(4)
Sw = [(SE2 + SC2 )/ 2]
Onde:
Sw o desvio-padro pooled within groups e
SE2 e SC2 so as varincias das amostras observadas nos grupos experimental e de controlo (i.e.
com N do denominador).
Resumindo, podemos definir as trs medidas
mais comuns da magnitude de efeito do tipo diferenas padronizadas, do seguinte modo:
(5)
(6)
(7)
O uso de ew ou de SW no denominador da
frmula (1) pressupe que o tratamento experimental no altera a variabilidade do grupo expe147
rimental. Este pode ser um pressuposto demasiado forte e irrealista. Por outro lado, ew tem a
vantagem de ser uma estimativa no-enviesada
da variabilidade verdadeira na populao, quer a
hiptese nula seja verdadeira, quer no (Glass, &
Hopkins, 1996). Para alm disso, com o desenvolvimento de mtodos de meta-anlise, foi demonstrado que o d de Cohen est menos enviesado que o d de Glass. Note-se tambm que o
valor de g de Hedges ser sempre menor que o
de d de Cohen. Por estas razes, o d de Cohen
tem ganho maior aceitao entre os investigadores. De qualquer forma, ao relatar valores de
magnitude do efeito do tipo diferenas padronizadas, o investigador tem a responsabilidade
de informar os leitores de qual a frmula que foi
utilizada.
A MAGNITUDE DO EFEITO E A
SIGNIFICNCIA PRTICA
Uma anlise dos valores acima citados leva-nos concluso de que um d= 1.4 representa
um efeito superior a um d= 0.4. Mas ser assim
mesmo? E quo grande suficientemente grande? Esta a questo fundamental da estatstica
aplicada e a pergunta a que os testes de hiptese,
e os seus valores associados de p, respondem
presumivelmente com clareza. Ao adoptar uma
metodologia que enfatiza a magnitude do efeito,
quer como complemento quer em substituio
dos testes de hiptese, no podemos fugir a esta
questo primordial.
Tem havido vrias tentativas de estabelecer
um guio geral que caracterize os nveis de
magnitude do efeito segundo as categorias de
pequeno ou grande. Talvez o mais conhecido seja o esquema de Cohen (1988) que sugeriu d= 0.2 como sendo um efeito pequeno, d=
0.5 como intermdio e d= 0.8 como grande.
Para alguns autores (e.g. Barnette & McLean,
2002b), o estabelecimento dessas categorias foi
um erro grave. Mesmo assim, muitos investigadores agarraram-se a estes termos a fim de facilitar a interpretao dos efeitos observados.
Mas quem fizer isso est por certo a simplificar
demasiado as suas concluses. O prprio Cohen
avisa-nos contra o uso arbitrrio destes termos
indicando que
Os termos pequeno, intermdio e
grande so relativos, no s uns perante
os outros, mas em relao rea cientfica
em que o estudo se insere, ou mais particularmente, relativamente ao contedo e
mtodo de investigao usados num determinado estudo (...) O uso de um quadro
de referncia comum (...) recomendado
somente no caso de no existir nenhuma
base de comparao melhor (1988, p. 25).
Relativamente mesma problemtica, Glass
afirma,
No faz sentido tentar associar regies da
medida de magnitude do efeito com adjectivos descritivos como pequeno,
moderado, grande etc. Desligado de
um contexto de deciso e valor comparativo, no existe valor inerente a uma
d a magnitude do efeito;
Mps o valor mdio observado no ps-teste;
Mpr o valor mdio observado no pr-teste;
DP uma medida de variabilidade, por exemplo o desvio-padro.
Permanece a polmica da escolha do valor de
DP nesta frmula. Uma vez que h fortes razes
para pressupor uma alterao na variabilidade
numa amostra de sujeitos do pr- para o psteste, o argumento de Glass (no sentido de utilizar o desvio-padro controlo aqui o e do
pr-teste) parece particularmente forte. Por outro
lado, as vantagens j referidas do uso de ew ou
Sw no denominador tambm permanecem na
situao pr-ps. O investigador cuidadoso informar os seus leitores de decises tomadas
nesse sentido e acerca das respectivas justificaes.
Deve-se mencionar que a frmula (8) indicada para a anlise de dados primrios. prtica corrente, no mbito de estudos de meta-anlise, utilizar frmulas para transformar valores
estatsticos (por exemplo t ) em valores de d. Se
for essa a inteno do investigador, imprescindvel relembrar que as frmulas de transformao so diferentes para os delineamentos envolvendo grupos independentes e os de medidas
repetidas. Cortina e Nouri (2000) apresentam as
respectivas frmulas de transformao. Realce-se que, no delineamento de medidas repetidas, a
correlao entre os valores pr e ps um elemento imprescindvel no clculo da magnitude
de efeito obtido base de valores estatsticos.
Por esta razo, o investigador dever sempre relatar o valor da correlao entre valores de pr-teste e ps-teste.
No caso de um estudo feito com um delineamento pr-teste / ps-teste, a magnitude do efeito dada por:
(8)
Onde:
Uma outra abordagem descrio da magnitude do efeito em estudos que usam um delineamento pr- ps o ndice de mudana fiel (Reliable Change Index-RCI) sugerido por Jacobson
e Truax (1991).
Em questes relacionadas com a eficcia de
uma dada terapia, um objectivo comum descrever se um determinado cliente/paciente demonstrou melhoria em relao sua situao
149
clnica inicial. Sendo assim, no suficiente focar a mudana de mdias de grupos. Para alm
disso, no suficiente descrever melhoria apenas
em relao posio clnica inicial do cliente,
uma vez que um cliente pode ficar melhor sem
ficar bom. Assim, na situao de terapia, o terapeuta tem que responder a duas perguntas: (a)
Ser que a mudana observada no cliente verdadeira? Por outras palavras, ser que a mudana
observada no se deve apenas a erro de medida?;
e, (b) Ser que a mudana observada coloca o
cliente dentro das normas de grupos funcionais?
Com o objectivo de responder a essas questes, Jacobson e Truax (1991) sugerem que a
diferena observada entre o ps-teste e o pr-teste seja dividida pelo erro padro da diferena
(Sdif) a fim de criar um ndice de mudana fiel.
O erro padro da diferena o desvio padro de
uma distribuio terica de mudanas (diferenas) que iro ser observadas numa populao, se
de facto, no houver mudana na populao
(i.e. erros de diferena que sero observveis se
a diferena verdadeira for de zero). Assim, a mudana observada no cliente posta prova relativamente ao erro de medida e fidelidade do
instrumento usado. Aps a verificao de que a
mudana observada verdadeira, ento comparada com as normas previamente definidas.
O ndice de mudana fiel dado por
(9)
Sdif = (2 (Sem)2)
Onde
Sem o erro padro de medida,
DP o desvio-padro do instrumento
r xx uma estimativa da fidelidade do instrumento.
Assim, tendo disponvel o desvio-padro do
instrumento utilizado e uma estimativa da sua
fidelidade, podemos calcular o Sdif e o RCI.
Deste modo, o ndice RCI relata a mudana
150
FIGURA 1
ndice de mudana fiel: Dados fictcios apresentados no formato recomendado por Jacobson
& Truax (1991)
coeficiente de determinao, diz-nos qual a proporo de variabilidade contabilizada (explicada) por uma relao linear entre duas variveis.
Assim, a correlao r =.50 d origem a um
valor de r2 = .25, ou seja 25% da variabilidade
observada explica-se atravs de uma possvel
relao linear entre os dois factores. O coeficiente de correlao mltipla, R, quando elevado
ao quadrado, d-nos a proporo da varincia
explicada por uma relao linear entre uma varivel prevista e um conjunto de variveis de
previso. Os coeficientes r2 e R2 so as medidas
de magnitude do efeito mais comuns na investigao efectuada com uma anlise correlacional
e de regresso. No caso de se utilizar, como
vulgar hoje em dia, um software estatstico,
pode constatar-se que este tipicamente relata
no s o R2 mas tambm o R2 ajustado (uma vez
que o R2 baseado numa amostra sobre-estima,
em geral, o valor na populao). Se utilizar um
valor de R2 como uma magnitude do efeito, o
151
Vrios autores notaram que 2 se encontra enviesado positivamente (Hays, 1981; Huberty,
1994). Hays props ento 2 como uma alternativa no enviesada: O clculo de 2 dado por
(13) 2 = (SStrat (k 1) MSerro) / (SStotal +
MSerro)
Barnette e McLean (2002a) descreveram a
relao entre d, 2 e 2 . Estes autores realizaram um estudo tipo Monte Carlo e concluram
que a relao entre 2 e 2 linear e previsvel
seja qual for a dimenso da amostra. Contudo, a
relao entre estas medidas e d mais varivel:
Quando o nmero de grupos analisados de k=2,
a relao essencialmente linear; mas nas situaes de k > 2 essa relao desmantela-se rapidamente.
Ainda no se encontram bem desenvolvidos
152
Depois de efectuar uma anlise do cruzamento de duas variveis nominais e a anlise de frequncias por clulas, enfrentamos o mesmo problema que surge relativamente aos testes paramtricos: nem o valor da medida estatstica,
nem o valor associado de p, nos dizem alguma
coisa sobre a intensidade da relao entre as duas
variveis. O 2 significativo, por exemplo, implica apenas que o investigador rejeita a probabilidade de independncia total das duas
distribuies. Assim, aps ter efectuado uma
anlise do tipo 2, aconselhvel calcular e relatar uma estimativa da magnitude do efeito. Dependendo da situao experimental, existe uma
srie de medidas teis e ao dispor do investigador. Algumas (por exemplo , , e V de Cramr) j foram descritas por Siegel (1975) e
Hays (1972; 1981) e encontram-se, geralmente,
disponveis como opes em SPSS verso 11.0,
(Analyze>Descriptive Statistics>Crosstabs/ Statistics). Outros, como BESD e o Rcio de Probabilidades, so menos conhecidos.
e2
O uso do coeficiente phi ( ) mais indicado
na situao em que a tabela de contingncia tem
apenas duas colunas e duas filas. Aps ter
efectuado uma anlise de 2 , o valor desse
coeficiente dado por
(14)
= (2 / N)
.50 + r / 2
e a taxa de insucesso (ou seja, sucesso associado com o placebo) calcula-se por
(16)
.50 r / 2
QUADRO 1
Melhoria No Observada
Total
Tratamento
.70
.30
Ntratamento
Placebo
.30
.70
Nplacebo
Nmelhoria
Nno melhoria
Total
153
nistrado um tratamento e outra metade um placebo, e se metade da populao melhora e a outra metade no, qual o aumento na taxa de sucesso que podemos esperar observar devido ao
efeito do tratamento? Wolf (1986, p. 33) fornece
uma tabela indicando o aumento na taxa de sucesso para vrios valores de r.
V de Cramr
O coeficiente um caso especfico da medida mais generalizada V de Cramr. Nomeadamente, V = se o nmero de colunas e linhas
na tabela de contingncia for de dois (Iversen &
Gergen, 1997). Sendo assim, o uso de V como
uma medida de magnitude do efeito especialmente indicado quando o nmero de colunas ou
linhas na tabela de contingncia for maior que
dois. O clculo desta mtrica dado por
(17)
V = [(2 / N (L-1)]
de Goodman e Kruskal
At que ponto ser possvel prever a preferncia de um aluno em relao apresentao de
matria curricular, se soubermos qual o estilo de
aprendizagem do aluno? Para responder a esse
QUADRO 2
Estilo A
Estilo B
Estilo C
Total
Verbal
150
90
10
250
Visual
30
40
90
160
Total
180
130
100
410
154
a probabilidade de errar ao prever a posio daquele aluno relativamente preferncia por apresentao verbal ou visual.
O Rcio de Probabilidades
Odds ratio (Haddock, Rindskopf, & Shadish,
1998; Rudas, 1998) pode ser traduzido como rcio de probabilidades, rcio de diferenas, disparidades de proporo ou at rcio de partido
ou aposta. A ideia simples para quem j trabalhou com tabelas de contingncias e lembra-nos a situao que requer uma anlise do tipo
qui-quadrado. O rcio de probabilidades muito
comum nos estudos mdicos de sobrevivncia
uma vez que associa a presena de um factor
(por exemplo, Tratamento versus Placebo) com
um acontecimento (por exemplo, Sobrevivncia
versus Morte). Imagine um estudo no mbito da
reinsero social. Um grande nmero de reclusos, prestes a sair da priso, participa em dois
programas de interveno com vista sua
reinsero na sociedade. Realiza-se um estudo
longitudinal a fim de avaliar a eficcia dos dois
programas, P1 e P2. Pergunta-se, aps um perodo de cinco anos, qual a taxa de reincidncia
nos dois grupos? Apresentam-se no Quadro 3
dados fictcios para um tal estudo.
primeira vista parece que o programa de
interveno P1 foi mais eficaz que o programa P2
e podemos efectuar uma anlise do tipo qui-quadradro para ensaiar a hiptese de independncia
de programas de interveno e o resultado em
termos de reincidncia. A fim de descrever a
magnitude de efeito, contudo, determinamos o
rcio de probabilidades (RP). O rcio dentro do
programa P1 de 75:25, ou 3:1 a favor da situa-
QUADRO 3
Rcio de probabilidades: Dados fictcios para um estudo de taxa de reincidncia aps cinco anos
Programa de Reinsero Social
P1
P2
75%
60%
25%
40%
155
didas de magnitude do efeito so iguais aos procedimentos para calcular um intervalo volta de
outras estatsticas, por exemplo, volta de um
valor mdio: Primeiro, calcula-se o erro padro
de d e seguidamente multiplica-se esse valor por
um valor crtico da escala de z (por exemplo,
1.96, a fim de criar um intervalo de confiana de
95%). O produto desses factores ento somado
e subtrado do valor observado de d, produzindo
os limites superiores e inferiores do intervalo.
Contudo, este procedimento foi questionado
por alguns autores (Cumming & Finch, 2001;
Steiger & Fouladi, 1997; Thompson, 2002b)
que defendem que a determinao dos limites
superior e inferior dos intervalos volta de
magnitudes de efeito dever ser efectuada
usando distribuies no-centrais. Uma anlise
mais aprofundada desta polmica extravasa o
presente trabalho. A temtica apenas mencionada de forma cursiva no sentido de alertar o leitor para o facto de que, embora a incluso de intervalos de confiana volta de magnitudes de
efeito seja um objectivo desejvel, no necessariamente uma tarefa simples. No futuro, face a
um maior desenvolvimento das metodologias
de medidas estatsticas de magnitude do efeito,
por certo esta questo vir a ser clarificada.
CONCLUSO
REFERNCIAS
APA (1994). Publication manual of the American Psychological Association (4 edio). Washington,
DC: Autor.
APA (2001). Publication manual of the American Psychological Association (5 edio). Washington,
DC: Autor.
Barnette, J., & McLean, J. (2002a, Abril). Shedding
light on the eta-square and omega-square relationships with the standardized effect size. Paper presented at the annual meeting of the American Educational Research Association. New Orleans, LA.
Barnette, J., & McLean, J. (2002b, Abril). The need to
abolish the arbitrary effect size standards. Paper
presented at the annual meeting of the American
Educational Research Association. New Orleans:
LA.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum.
Conboy, J. (2002). A magnitude de efeito como forma
de anlise em cincias sociais. Lusiada Psicologia, 1 (1), 187-210.
Conboy, J. (2000). Estimando a dimenso do N de uma
amostra. INUAF Studia, 1 (2), 227-274.
Cooper, H. (1997). Some finer points in meta-analysis.
In M. Hunt (Ed.), How science takes stock: The
story of meta-analysis (pp. 169-181). New York:
Russell Sage Foundation.
Cooper, H., & Hedges, L. (1994). The handbook of research synthesis. New York: Russell Sage Foundation.
Cortina, J., & Nouri, H. (2000). Effect size for ANOVA
designs. Thousand Oaks, CA: Sage.
RESUMO
As medidas de magnitude do efeito representam
uma resposta eficaz s diversas crticas s metodologias de investigao tradicionalmente utilizadas nas
cincias sociais. Tais medidas evitam algumas das dificuldades mais evidentes dos testes de hiptese; so
de interpretao simples, sem o recurso a valores de p,
que podem ser enganadores; e fornecem uma base para
a sntese de grande nmero de estudos. Este artigo descreve o clculo e interpretao das formas mais comuns desta abordagem alternativa, ou complementar,
aos testes de hiptese. Pressupe-se que o leitor dispe
de um conhecimento bsico de estatstica aplicada sem
ter, necessariamente, uma forte formao em estatstica matemtica.
Palavras-chave: Magnitude do efeito, Mtodos de
Investigao, Anlise de Dados, Cincias Sociais.
157
ABSTRACT
Measures of effect size represent an alternative to
traditional methods of data analysis in the social
sciences. These metrics avoid some of the most evident problems associated with tests of hypotheses, are
more simply interpreted than sometimes misleading p
values, and provide the basis for the synthesis of large
158