Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Carlos Antnio de Souza Teles Santos , Lia Terezinha Lana Pimenta de Moraes ,
2
1
2
Salvador, 2012
Agradecimentos
Esse projeto foi financiado pela Fundao de Amparo Pesquisa do Estado da Bahia
(FAPESB), Termo de Outorga n.0082/2006. Agradecemos ainda a equipe coordenada pelo
Prof. Dr.Maurcio L. Barreto, do Instituto de Sade Coletiva da UFBA, pela disponibilidade
dos dados utilizados neste relatrio. Parte desses dados proveniente do estudo Avaliao
do Impacto Epidemiolgico do Programa de Saneamento Ambiental da Baa de Todos os
Santos - Bahia Azul, que teve suporte do Programa de Ncleo de Excelncia (PRONEXCNPq/MCT, Brazil), Contrato num. 66.1086/1998-4 e da Secretaria de Desenvolvimento
Urbano, Bahia.
LISTA DE ILUSTRAES
12
13
14
15
18
19
32
37
39
41
42
Figura 13: Diagrama de caminhos para SEM mais complexo para descrever o
desenvolvimento cognitivo infantil
43
44
SUMRIO
1 Introduo
10
12
14
15
16
19
22
24
26
27
29
32
33
3 Aplicaes da SEM
36
36
40
4. Consideraes finais
45
Referncias bibliogrficas
46
1 Introduo
A modelagem com equaes estruturais (SEM, em ingls) considera vrios tipos de
procedimentos estatsticos para avaliar relaes entre variveis observadas, com o objetivo de
permitir a realizao de anlises quantitativas sobre modelos tericos hipotetizados pelo
pesquisador. A SEM tem-se mostrado um mtodo flexvel e poderoso para estimao de
parmetros em uma extensa famlia de modelos lineares incluindo o teste t de Student,
ANOVA, MANOVA e modelos de regresso mltipla. O aspecto mais importante da SEM,
no entanto, sua extenso para permitir a estimao de erros de medidas atravs do uso de
fatores ou variveis latentes mltiplas. Nesses modelos podem-se incluir variveis que no
so medidas diretamente, mas atravs de seus efeitos, denominados indicadores, ou de suas
causas observveis. Essas variveis no mensurveis so conhecidas por variveis latentes,
construtos ou fatores. Mais especificamente, vrios modelos tericos podem ser testados sob
a abordagem da SEM para avaliar como conjuntos de variveis observadas definem
construtos e como esses construtos relacionam-se entre si (Schumacker e Lomax, 2004).
Alm disto, este mtodo permite a avaliao de mecanismos mediadores complexos atravs
da decomposio dos efeitos (Bollen, 1987).
Nesta abordagem uma srie de equaes definida para descrever as estruturas hipotetizadas
nas relaes entre as diversas variveis includas na modelagem. Este mtodo consiste
basicamente na definio de modelos para a varivel latente e para as medidas observadas.
Uma caracterstica interessante dessa metodologia a possibilidade de que uma mesma
varivel seja resposta em uma equao e aparea como varivel explanatria em outra
equao. ainda possvel a especificao de um efeito recproco, ou seja, aquele no qual
duas variveis afetam uma outra atravs de um feedback loop. A aplicao desta
metodologia baseada na teoria utilizada pelo pesquisador para explicao das interrelaes
entre um conjunto de variveis, que podem ser classificadas como endgenas (dependentes)
ou exgenas (independentes). Este modelo terico pode ser ainda expresso por meio de
diagramas, que resumem um conjunto de hipteses.
Os mtodos modernos referentes SEM representam a confluncia de trabalhos que foram
realizados em vrias disciplinas, incluindo bioestatstica, econometria, psicometria e
estatstica social. Neste trabalho os conceitos fundamentais relacionados aos modelos de
equaes estruturais so apresentados, considerando-se os mtodos mais comumente
descritos na literatura (Bollen, 1989; Kaplan, 2000; Farias, 2000). Na seo 2 deste trabalho
ordinais e contnuas. Nesse trabalho, no entanto, discutiremos a SEM apenas para avaliao
de relaes envolvendo variveis contnuas.
2.1 Viso Histrica da Modelagem com Equaes Estruturais
Segundo Kaplan (2000), o modelo de equaes estruturais originou-se da aproximao de
duas reas distintas de aplicaes da Estatstica: a anlise fatorial, utilizada pela psicologia e
pela psicometria; e o modelo de equaes simultneas, utilizado inicialmente na econometria
e posteriormente aplicado gentica.
A anlise fatorial tem sua origem no trabalho de Galton (1869 apud Kaplan, 2000) e no de
Pearson (Pearson e Lee, 1904 apud Kaplan, 2000), porm no trabalho de Spearman (1904
apud Kaplan, 2000) que foi proposto o modelo de fatores comuns. Spearman props o uso de
um fator de capacidade geral para representar as habilidades mentais dos indivduos devido
existncia de interrelaes entre os testes de aptido e capacidade especficas. De forma
consistente com a definio geral da SEM dada por Kaplan (2000), a proposta de Spearman
(1904, apud Kaplan, 2000) considera a correlao entre os termos de um conjunto de
parmetros estruturais. Spearman e outros pesquisadores compem a chamada escola
britnica de anlise fatorial. A idia bsica da anlise fatorial que se existe um conjunto de
itens correlacionados, as respostas individuais a cada um desses itens podem ser somadas
para definir um escore que, por sua vez, estabeleceria ou implicaria em um construto
(Schumacker e Lomax, 2004).
Na dcada de 1930, na Universidade de Chicago, Thurstone e colaboradores questionaram as
definies de Spearman, argumentando a existncia de um nmero maior de fatores referidos
como habilidade mental primria (Thurstone, 1935 apud Kaplan, 2000). Muito debate
surgiu em torno dessa questo, motivado pelo princpio da parcimnia (Mulaik, 1972 apud
Kaplan, 2000). Pesquisadores da escola britnica, como Mulaik (1972 apud Kaplan, 2000),
utilizaram a correlao existente entre os fatores para validar suas pretenses sobre um fator
de habilidade geral unitrio. Durante as dcadas de 1950 e 1960, o acesso mais amplo
computao
fez
com
que
anlise
fatorial
ganhasse
enorme
popularidade,
econmicos comeou com Petty, em 1676 (Spanos, 1986 apud Kaplan, 2000). Porm, com
respeito SEM, a contribuio inicial encontra-se no trabalho de Haavelmo (1943 apud
Kaplan, 2000). Haavelmo utilizou o sistema de equaes simultneas para modelar a
interdependncia entre variveis econmicas utilizando a expresso y = y + x + , onde y
o vetor de variveis endgenas que o modelo pretende explicar; x o vetor de variveis
exgenas, que so propostas para explicar y mas cujo comportamento no explicado; o
vetor que representa a perturbao; e B e representam as matrizes dos coeficientes do
modelo. Este modelo foi a maior inovao na modelagem economtrica. Seu
desenvolvimento e refinamento foi objeto de pesquisa de estatsticos e econometricistas na
Universidade de Chicago, em 1945, e depois em Yale (Berndt, 1991 apud Kaplan, 2000),
com nfase no estudo do recm-desenvolvido modelo de equaes simultneas com o mtodo
de estimao de mxima verossimilhana, associado s metodologias de testes de hipteses
(Hood e Koopmans, 1953; Koopmans, 1950 apud Kaplan, 2000). Nos 25 anos seguintes, as
pesquisas economtricas caminharam no sentido do refinamento dos procedimentos de uso
das equaes simultneas (Fisher, 1966 apud Kaplan, 2000). O modelo de equaes
simultneas apresentado, embora utilizado por um tempo longo, foi objeto de diversas
crticas. Seus crticos afirmavam que um grave problema com grandes modelos
macroeconmicos de equaes simultneas era que no poderiam competir com mtodos de
distribuies livres nos modelos de sries temporais de Box-Jenkins para previses precisas
(Cooper, 1972 apud Kaplan, 2000).
SEM definida pela combinao das duas tcnicas brevemente historiadas. A combinao
dessas metodologias na forma corrente teve incio no trabalho de Jreskog (1973 apud
Kaplan, 2000), Keesling (1972 apud Kaplan, 2000) e Wiley (1973 apud Kaplan, 2000). O
modelo geral de equaes estruturais, delineado por Jreskog (1973, apud Kaplan, 2000),
consiste em dois submodelos: (a) o modelo de medio, onde as variveis observadas so
relacionadas s variveis latentes atravs de anlise fatorial confirmatria; e (b) o modelo
estrutural, que se refere parte do modelo que relaciona as variveis latentes umas as outras
por meio de sistemas de equaes simultneas. Esses modelos so discutidos mais
detalhadamente nas sees 2.4 e 2.6.
O avano nos modelos de equaes estruturais levou ampliao de sua aplicao para
diferentes reas do conhecimento. Atualmente tem-se observado o uso da SEM em:
10
A crescente popularidade da SEM est relacionada a diversos fatores, incluindo o fato dos
pesquisadores estarem tornando-se mais conscientes da necessidade de uso de mltiplas
variveis observadas para entender melhor sua rea de investigao cientfica. Os mtodos
estatsticos tradicionais podem ser utilizados apenas para um nmero limitado de variveis,
que podem no ser capazes de dar conta das sofisticadas teorias que vm sendo
desenvolvidas. Outra razo refere-se ao crescente reconhecimento da validade e
confiabilidade de escores observados a partir de instrumentos de mensurao, sendo que o
SEM permite a incluso explcita de erros de mensurao. Alm disso, a disponibilidade de
vrios softwares de fcil uso pelos pesquisadores, permitindo a implementao desde os
modelos mais simples at SEM mais sofisticada, tem sido um motivo adicional para o amplo
uso dessas metodologias nos dias atuais.
2.2 Tipos de variveis nos modelos de equaes estruturais
As variveis na SEM podem ser classificadas em relao a diversos aspectos do modelo.
Quanto ao aspecto de serem mensurveis ou no, elas podem ser classificadas como variveis
latentes, variveis de medio e variveis indicadoras. Variveis que no so mensurveis
diretamente so chamadas de variveis latentes ou construtos e dizem respeito a conceitos
toricos que no podem ser observados diretamente. Se construtos forem observados
11
diretamente, no ser possvel medi-los sem a ocorrncia de erros. Na abordagem com SEM
os construtos permitem a formao das relaes causais a serem estimadas pelos modelos e
so medidos, aproximadamente, por um conjunto de variveis observadas. Segundo Hair e
colaboradores (2005), construtos ou variveis latentes podem tambm estar relacionados com
variveis de medio (ou variveis observadas) em uma relao de dependncia. Em SEM,
convencionalmente, assume-se que as variveis de medio so dependentes dos construtos.
Assim, em um diagrama de caminhos a seta apresenta o seguinte sentido: parte do construto
em direo s variveis de medio que foram utilizadas para a construo da varivel
latente. Uma varivel latente ou construto resultado da combinao de diversas variveis de
medio. Assim, aquelas variveis observadas que so utilizadas para a construo de uma
varivel latente so chamadas de variveis indicadoras. O pesquisador deve justificar a base
torica das variveis indicadoras porque a SEM examina apenas as caractersticas empricas
das variveis. Para cada construto que aparece no modelo necessrio determinar quais so
as variveis indicadoras que esto relacionadas com ele.
O uso de variveis latentes em SEM permite a melhoria da estimao estatstica por dois
motivos: representa os conceitos toricos de forma mais adequada; e incorpora o erro de
mensurao. Os erros de mensurao resultam de respostas imprecisas e do uso de conceitos
toricos - construtos. Entretanto, se a magnitude dos problemas que geram os erros
conhecida, possvel incorporar a confiabilidade na estimao do modelo. Na estimao das
relaes entre variveis dependentes e independentes, o modelo de medio permite avaliar a
contribuio de cada item da escala de mensurao, bem como incorporar ao modelo a escala
que melhor mede o conceito.
Quanto influncia que uma varivel exerce sobre outras, as variveis so classificadas como
exgenas e endgenas. So chamadas de variveis exgenas aquelas variveis que no so
influenciadas ou no sofrem efeito de outras variveis do modelo, sendo tambm chamadas
de independentes ou preditoras. Como no modelo de regresso tradicional, assume-se que
essas variveis so mensuradas sem erro. Essas variveis podem ser quantitativas ou
qualitativas. As variveis endgenas ou variveis dependentes so aquelas que recebem
influncia de outras variveis presentes no modelo. Os erros estruturais (ou disturbances)
representam as causas omitidas agregadas das variveis endgenas, juntamente com o erro de
mensurao. Assim, haver um erro associado a cada varivel endgena do modelo. Para os
modelos discutidos neste trabalho estaremos considerando que essas variveis so contnuas.
12
13
necessaria
Quando duas variveis no esto ligadas atravs de uma seta no implica necessariamente
que uma no afete a outra. Essa relao pode ocorrer indiretamente, podendo ser identificada
identi
atravs de caminhos mais complexos.
Figura (b): Uma segunda varivel dependente Y2 foi adicionada ao modelo descrito
em (a). Alm da equao de
definida para (a), ser necessria uma segunda equao para
representar a relao entre X2 e Y1 (variveis exgenas) com a varivel endgena Y2.
Observa-se
se que a varivel X2 compartilhada pelas duas equaes e que Y1 varivel
endgena
gena na primeira equao e varivel exgena
ex
na segunda.
14
15
representam construtos ou variveis latentes. Esta parte do modelo est relacionada ao uso de
anlise fatorial confirmatria, que determina a forma como as variveis latentes so
construdas a partir das variveis observadas. O modelo de medio oferece ainda uma
descrio das propriedades de mensurao (validade e confiabilidade) dessas variveis.
O modelo estrutural, por sua vez, mostra como os construtos esto associados uns com os
outros. Seu desenvolvimento fundamenta-se no clculo de sistemas de equaes simultneas.
Nessa etapa da SEM esto os procedimentos de especificao e estimao das associaes
das variveis latentes entre si ou com outras variveis observveis, descrevendo seus efeitos e
suas magnitudes. Incluem tambm as informaes sobre a varincia explicada e a no
explicada de cada termo endgeno presente no modelo.
Ambos os submodelos podem ser bastante complexos. O esquema de um modelo convencional de SEM na forma de diagrama de caminhos apresentado na Figura 5. O modelo
de medio pode ser especificado em termos das variveis exgenas ou em termos das
variveis endgenas. No diagrama de caminhos existem uma ou mais setas que conduzem at
uma varivel endgena.
16
(1)
17
(2)
y (I - ) = + x +
(3)
Assumindo-se que (I - ) no singular, ento sua inversa pode ser definida e a equao (3)
pode ser reescrita como:
y = ( - )-1 + ( - )-1x + ( - )-1
= 0 + 1x + * ,
(4)
(5)
18
(6)
e
E ( y, x) = yx
E ( y' y)
=
E ( x' y )
E ( yx' )
E ( x'x)
( - )-1
(7)
onde (6) e (7) mostram que a modelagem por equaes estruturais representa o vetor de
mdia e a matriz de covarincia. Essa estrutura definida em termos dos parmetros do
modelo.
Usualmente para simplificar as equaes estruturais, considera-se o uso de variveis
centradas em sua mdia (Fox, 2008; Mueller, 1999). Com isso, os termos contendo os
interceptos nas equaes anteriores tornam-se zero, reduzindo-se a forma matricial desse
modelo para:
y = y + x +
(8)
19
de . Alm disso, esse modelo no contm covarincias entre os termos de rudo. Assim,
uma matriz diagonal cujos elementos representam as varincias dos rudos. Tipicamente os
coeficientes estruturais das matrizes e contm alguns zeros, e os elementos da diagonal
de so iguais a 1. Pode-se escrever esse modelo para a Figura 6 como:
x1
y1 0 0 y1 11 12 13 e1
=
+
x2 +
y2 21 0 y2 0 0 0 x e2
3
(9)
Nos modelos no recursivos, por sua vez, existe um loop entre variveis endgenas do
modelo, o que implica que no triangular inferior. Alm disso, muitas vezes considera-se
a existncia de um termo de covarincia entre os rudos das variveis endgenas envolvidas
no loop. Nesse caso, uma matriz simtrica, com elementos no nulos fora da diagonal
principal. Este tipo de modelo implica em uma especificao dinmica do modelo estrutural,
que pode causar problemas de instabilidade do procedimento de estimao. O modelo para a
Figura 7 pode ser definido como:
y1 0 12 y1 11
=
+
y2 21 0 y2 0
12
0
x1
0 e1
x2 +
23 e2
x3
(10)
os coeficientes de regresso em e .
20
F ( S , ) 0 ,
F ( S , ) = 0 , se e apenas se = S ,
f ( z ) = ( 2) ( p + q ) / 2 2 exp z ' 1z
2
N
1 '
1
2 exp zi ( ) zi
2
N ( p + q)
N
1 N
log( 2) log tr[ zi' ( ) 1 zi ]
2
2
2 i =1
N ( p + q)
N
N N
log( 2) log tr[ N 1zi zi' ( ) 1]
2
2
2 i =1
21
N ( p + q)
N
N N
log(2) log tr[( ) 1]
2
2
2 i =1
log L( ) =
N
log + tr[ S( )1]
2
N
ser removido, o que
2
) = E log L( )
cov (
'
2
) = log L( ) a matriz de informao de Fisher. Os erros padro podem ser
onde I (
'
obtidos pela raiz quadrada dos elementos da diagonal principal da matriz de covarincia
assinttica das estimativas.
O estimador de mnimos quadrados generalizados (GLS) tambm assume que os dados so
provenientes de uma distribuio normal multivariada. A forma geral da funo de
discrepncia ajustada pelo GLS dada por:
22
1
FGLS = tr[ S 1 ( S )]2
2
1
= tr ( S 1)2
2
Sob a suposio de normalidade multivariada, o estimador GLS assintoticamente normal e
eficiente.
Um nmero mnimo de observaes deve ser requerido para que SEM possa ser utilizado. De
acordo com Mueller (1996), recomenda-se que a razo entre o tamanho da amostra e o
nmero de parmetros a ser estimado pelo modelo seja de 10:1 ou mesmo de 20:1, se testes
de significncia estatstica so de interesse.
23
identificados.
De modo geral, algumas restries precisam ser impostas aos modelos para que no haja
problemas de identificabilidade. Essas restries incluem:
Normalizao: requer que os elementos da diagonal de sejam zero (ou seja, uma
varivel endgena no pode ter um efeito direto sobre ela mesma);
Definio de uma mtrica para os termos de rudo . A forma mais comum feita
fixando-se os coeficientes que relacionam as variveis endgenas aos termos de rudo
em 1 (um).
1
s( s + 1) . Considere ainda que seja t o nmero de parmetros a serem estimados
2
pelo modelo. Dessa forma, uma condio necessria para a identificabilidade do modelo
que t
1
s ( s + 1) .
2
Se t =
1
s( s + 1) ento o modelo dito just identified [exatamente identificvel];
2
Se t <
1
s( s + 1) ento o modelo dito overidentified [super-identificvel];
2
Se t >
1
s( s + 1) ento o modelo dito not identified [no identificvel].
2
Para ilustrao do uso da regra da contagem, suponha, por exemplo, que os parmetros a
serem estimados pelo modelo so 10 varincias e covarincias de variveis exgenas e 8
coeficientes de regresso (t = 18). Nesse exemplo, considere que s = 7 e o nmero de
elementos no redundantes em igual a 28. Nesse caso, como t < 28, o modelo super-
24
identificvel.
A maior vantagem da regra da contagem sua simplicidade. No entanto, essa regra
necessria, mas no suficiente. Nesse caso, pode-se considerar a regra recursiva para a qual
uma condio suficiente que B seja triangular e que seja uma matriz diagonal. Isso
implica que todo modelo recursivo identificvel, pois no contm covarincia entre os
termos de rudo. Verifique que estas condies so satisfeitas no exemplo apresentado em
(9).
Outra condio que necessria e suficiente para identificabilidade do modelo denominada
condio de posto da matriz (rank condition). De acordo com esse procedimento, para que o
modelo de equao estrutural seja identificvel necessrio ter pelo menos o mesmo nmero
de variveis exgenas e parmetros a serem estimados na equao.
Suponha que existam q variveis exgenas no modelo. Pela condio anterior tem-se que:
overidentified [super-identificvel];
Se um modelo tem mais que q parmetros estruturais ento o modelo dito not
25
caso, o valor do qui-quadrado varia entre zero, quando se considera o modelo saturado, e um
valor mximo, quando no se considera nenhuma relao entre as variveis (modelo
independente). Um resultado estatisticamente no significante para o qui-quadrado indica que
a matriz de covarincia amostral e a matriz de covarincia estimada pelo modelo so
similares. Muitos dos critrios de ajuste so calculados com base no conhecimento do modelo
saturado, no modelo independente, no tamanho amostral, nos graus de liberdade e nos valores
do qui-quadrado para formular um ndice que varia entre 0 (ajuste inadequado) e 1 (ajuste
perfeito).
Tabela 1. Principais critrios de ajuste para o SEM.
Medida de ajuste
Comentrios
Qui-quadrado
p > 0,05
Qui-quadrado/gl
Jrskog Sorbom
ndice de Bondade (GFI)
Refere-se
proporo
da
covarincia observada que
explicada pela covarincia do
modelo
Jrskog Sorbom
1 refere-se ao ajuste perfeito
ndice de Bondade Ajustado
Objetivo > 0,9
(AGFI)
ndice de Comparao do 1 refere-se ao ajuste perfeito
Ajuste de Bentler (CFI)
Objetivo > 0,9
ndice de Tucker-Lewis
> 200
Inclui ajuste
complexos
para
modelos
Recomenda-se que vrios critrios de bondade do ajuste sejam usados em combinao como
medida de ajuste global (Hair et al, 2005). Dentre os critrios de bondade de ajuste,
ressaltam-se:
a raiz do erro quadrtico mdio (RMSEA, em ingls), em que valores inferiores a 0,05
indicam um bom ajuste do modelo,
26
2
2modelo glmodelo
, RMSEA =
GFI = 1 modelo
( N 1) glmodelo
2nulo
2
glmodelo
e CFI = 1 modelo
2
nulo glnulo
y = ( )1 x + ( )1
Nesse caso, tem-se:
27
28
S
Sbk = Sbk xk
Sy
2
1 RYH
(1 RX2 G ) ( N K 1)
k k
ry1 (r12 ry 2 )
1 =
2
1 r12
ry 2 (r12 ry1)
2 =
2
1 r12
onde ry1 e ry2 representam os coeficientes de correlao de Pearson entre as variveis
independentes e dependentes e r12 representa o coeficiente de correlao de Pearson entre as
variveis independentes. No caso bivariado (modelo linear simples), ou seja, quando s existe
uma varivel independente, o coeficiente padronizado pode ser definido por:
= rxy ,
onde rxy o coeficiente de correlao de Pearson entre a varivel independente e a varivel
dependente.
Um terceiro mtodo consiste em padronizar todas as variveis includas na anlise atravs da
estatstica xzi dada por:
x X
.
x zi = i
S
29
x pi X p
yi Y
x X1
x X2
= 1 1i
+ 2 2i
+ ... + p
+ i ;
Sy
S x1
S x2
Sx p
i ~ N (0,1)
xq
pq
y p
Coeficientes padronizados tambm podem ser obtidos para efeitos diretos e indiretos do
modelo.
(11)
30
y = y + e
x = x +
=
=
yx yy
y ( - )-1x
y ( - )-1 x
x x +
B = 0, = 0, = 0, y = 0 e = 0 .
Em qualquer modelo em particular sero necessrias algumas restries em alguns elementos
31
dessa matriz. Mais comumente, algumas restries incluem fixar alguns desses parmetros
como zeros. Alm disso, algumas das matrizes contm valores fixos conforme discutido
anteriormente. Se as restries desse modelo so suficientes, ento estimativas de mxima
verossimilhana podem ser obtidas para esses parmetros.
A log-verossimilhana associada a esse modelo dada por:
loge L(, , x , y , , , ; ) =
N ( p + q)
N
loge 2 [loge det + trace( S 1)]
2
2
(12)
( p + q) ( p + q + 1)
2
Esta condio, no entanto, no suficiente. fcil atender a esta condio e ainda ter um
modelo no identificvel. Uma regra que s vezes pode ajudar na verificao da
identificabilidade do modelo a seguinte:
existem pelo menos dois indicadores exclusivos para cada varivel latente, ou se h
apenas um nico indicador para uma varivel latente, essa mensurada sem erro,
32
Essas etapas foram sumarizadas por Hair e colaboradores (2005) em estgios sequenciados,
que podem ser descritos como:
33
34
35
36
3 Aplicaes da SEM
Para ilustrao da aplicabilidade dos mtodos discutidos neste trabalho so apresentadas duas
anlises que foram conduzidas usando esta metodologia. Essas aplicaes incluem desde o
uso do modelo mais simplificado na abordagem SEM, contendo apenas anlise fatorial
confirmatria, at situaes mais complexas envolvendo modelos no recursivos. A
interpretao dos resultados em cada uma das aplicaes enfatizada.
37
7(7 + 1)
= 28
2
38
x1 11 0
1
x2 12 0
2
x
0
3 13
1 3
x4 = 14 0 + 4
2
x5 0 25
5
6
x6 0 26
x7 0 27
7
Analisando-se a Figura 9, pode-se notar que a varivel observada leite e derivados (carga
fatorial padronizada 12 = 0,84 ), referente ao consumo de calorias em crianas com menos
de 12 meses, possui a maior contribuio na formao do construto Fator 1 ( 1 ), enquanto
que no construto Fator 2 ( 2 ) a varivel que exerce a maior contribuio o arroz (carga
fatorial padronizada 27 = 0,77 ). Pode-se ainda perceber que existe uma correlao positiva
entre os Fatores 1 e 2 (r = 0,24).
Modelo de mensurao similar ao definido anteriormente considerado para ajuste usando
dados de consumo de calorias na dieta de crianas com faixa etria de 12 a 24 meses,
conforme apresentado na Figura 10. Nesse caso, verifica-se que a formao do construto
Fator 1 ( 1* ) deve-se principalmente ao consumo de leite e derivados (carga fatorial
padronizada *12 = 0,65 ), enquanto que no construto Fator 2 ( *2 ) novamente o consumo de
arroz (carga fatorial padronizada = *27 = 0,61 ) o que exerce uma maior contribuio na
formao do mesmo. Nota-se, no entanto, que existe uma fraca correlao negativa entre os
construtos Fator 1 e Fator 2 (r = 0,05).
Tabela 2. Estimativas no padronizadas para os dois modelos de perfil de
consumo alimentar segundo a faixa etria das crianas.
< 12 meses
12 - 24 meses
Variveis observadas
t
t
se( )
se( )
Acar e doces
Leite e derivados
Leite materno
Cereais
Carne
Feijo
Arroz
58,1
163,6
-56,6
70,8
15,8
15,3
32,0
5,6
12,2
4,5
8,6
2,6
2,5
4,6
10,3
13,4
12,5
8,3
6,2
6,2
7,0
80,2
213,3
-141,0
73,8
4,4
5,9
22,3
6,7
13,6
10,0
8,8
0,8
0,9
3,0
12,0
15,7
14,1
8,4
5,5
6,6
7,4
39
Comparando as Figuras 9 e 10, pode-se notar que apesar das distintas faixas etrias das
crianas, no parece haver diferena nos seus perfis alimentares, sendo que os fatores
definidos indicam dieta lctea (Fator 1) e uma dieta tradicional (Fator 2).
A Tabela 2 apresenta as estimativas no padronizadas dos modelos apresentados nas Figuras
9 e 10. De acordo com esses resultados, todos os parmetros estruturais (os coeficientes no
padronizados) na matriz x so significativos, bem como as varincias dos erros de
mensurao associadas aos indicadores do modelo (dados no apresentados). Contudo, as
correlaes mltiplas ao quadrado ( R 2 ) para os indicadores variaram entre 0,15 e 0,70 para
os dados de crianas menores de 12 meses, e entre 0,13 e 0,42 para os dados de crianas entre
12 e 24 meses, indicando confiabilidade questionvel para o padro alimentar nessas
amostras.
Critrios de ajuste do modelo so apresentados na Tabela 3 para os dados das crianas das
duas faixas etrias. Pode-se verificar que o modelo encontra-se bem ajustado considerando-se
os critrios definidos na Tabela 1.
40
41
A anlise das estimativas no padronizadas desse modelo indica que a maior parte dos
parmetros estruturais da matriz x so significativos (dados no apresentados). Ressalta-se,
no entanto, o fato dos parmetros associados ao construto nutricional no serem
significativos, indicando potencialmente a necessidade de melhor definio deste construto.
As varincias dos erros de mensurao associadas aos indicadores do modelo foram todas
42
x1 11
x2 12
x
3 13
x4 0
=
x5 0
x6 0
x7 0
x 0
8
(20)
0
1
0
0
2
0
0
1 3
24 0 4
2 +
25 0 5
3
26 0 6
0 37
7
0 38
8
43
software Amos. Pode-se identificar que a varivel observada IDM est sendo explicada pelas
variveis latentes fsico-ambiental, psico-social e nutricional e ainda pelas variveis
observadas idade e sexo, sendo que a varivel latente fsico-ambiental ( 2 padronizada =
0,49) aquela que exerce a maior influncia no desenvolvimento cognitivo infantil (IDM),
enquanto que a varivel latente psico-social no se encontra significativamente associada ao
IDM (p = 0, 69).
x1 11
x2 12
x = 1
3
x4 0
x5 0
(13)
0
1
0 1 2
0 2 + 3
0 3 4
1
5
0
0
1
0
e
y = y +
(14)
44
y1 21
y2 1
y
3 = 23
y4 0
y5 0
y 0
6
0
1
0
0
2
1
1
0 3
2 +
31 0 4
3
1
0
5
0
1
6
0 0 1 11 12 0 1 1
1 0
0 0 2 + 0
0 23 2 + 2
2 = 0
3 31 32 0 3 31 32 33 3 3
(15)
45
ambos os modelos encontram-se bem ajustados, no havendo diferenas importantes nos dois
modelos.
Tabela 4. Critrios de bondade de ajuste para os dois SEMs sobre
desenvolvimento cognitivo.
Valor das estatsticas
Medida de ajuste
Modelo 1 (simples)
Modelo 2 (complexo)
Qui-quadrado/gl
GFI
AGFI
CFI
NFI
RMSEA
1,576
0,967
0,943
0,930
0,837
0,043
1,667
0,967
0,940
0,924
0,837
0,046
4. Consideraes finais
Este trabalho abordou a modelagem com equaes estruturais envolvendo variveis
endgenas contnuas, que possui teoria estatstica j consolidada e tem sido amplamente utilizada em diversas reas do conhecimento. No entanto, vale ressaltar que existe tambm
literatura a respeito de SEM para respostas binrias ou, de maneira mais abrangente,
envolvendo contextos em que o pressuposto de multinormalidade no se aplica (Muthn,
1984).
Outra rea em crescente expanso o uso de SEM para situaes envolvendo estruturas
complexas de dados e que muitas vezes envolve correlao entre mltiplas observaes de
um mesmo indivduo ou entre indivduos pertencentes a um mesmo grupo ou cluster. A
aplicao do SEM em curvas de crescimento (Fergusson, 1997) ou usando a abordagem de
modelagem multinvel (Bauer, 2003) objeto de investigao deste grupo de pesquisa.
46
Referncias Bibliogrficas
AMORIM, Leila D. A. F. Structural equation modeling in epidemiology. Cadernos de Sade
Pblica, Rio de Janeiro, v. 26, n. 12, p. 2251-2262, 2010.
BAUER, Daniel J.. Estimating Multilevel Linear Models as Structural Equation Models,
Journal of Educacional and Behavioral Statistics, [S.l.], n. 28, 135-167, 2003.
BOLLEN, Kenneth. Total, Direct and Indirect Effects in Structural Equation Models,
Sociological Methodology, [S.l.], n. 17, 37-69, 1987.
______. Structural equations with latent variables. New York: Wiley, 1989.
CODES, Ana Luiza Machado de. Modelagem de equaes estruturais: um mtodo para a
anlise de fenmenos complexos. Caderno CRH, Salvador, v. 18, n. 45, p. 471-484, set./dez.
2005.
FARIAS, Salomo A.; SANTOS, Rubens da C. Modelagem de Equaes Estruturais e
Satisfao do Consumidor: uma Investigao Torica e Prtica. RAC, v. 4, n. 3, 107-132,
2000.
FERGUSSON, David M. Annotation: structural equation models in developmental research.
Great Britain: Cambridge University Press, 1997.
FERREIRA, H. S. et al. Sade de populaes marginalizadas: desnutrio, anemia e
enteroparasitoses em crianas de uma favela do Movimento dos Sem Teto, Macei,
Alagoas. Revista Brasileira de Sade Materno Infantil, Recife, n. 2, 177-185, 2002.
FOX, John. Structural Equation Modeling with the SEM package in R. Structural
Equation Modeling: A Multidisciplinary Journal. v.13, n. 3, 465-486, 2006.
HAIR Jr., JOSEPH F.; Anderson, ROLPH E.; TATHAN, Ronald L.; BLACK, William C.
Anlise multivariada de dados. Traduo Adonai Schlup SantAnna e Anselmo Chaves Neto.
5. ed. Porto Alegre: Bookman, 2005.
JACKSON, J. A.; DEZEE, K.; DOUGLAS, K.; SHIMEALL, W. Introduction to Structural
Equation Modeling (Path Analysis). [S.l.]: SGIM Precourse PA08, 2005.
KAPLAN, David. Structural equation modeling. Foundations and extensions. USA: Sage
Publications, 2000. Advanced Quantitative Techniques in the Social Sciences Series, v. 10.
KLINE, Rex B. Principles and practice of structural equation modeling. 2. ed. New York:
The Guilford Press, 2004.
MATOS, Sheila M. A. Prevalncia de enteroparasitoses e sua relao com o estado
antropomtrico na infncia, Salvador-BA. Salvador: ISC/UFBA, 2006. Dissertao de
mestrado em Sade Coletiva. Instituto de Sade Coletiva. Universidade Federal da Bahia.
MUELLER, R. O. Basic principles of structural equation modeling: An introduction to
LISREL and EQS. New York: Springer-Verlag, 1996.
MUTHN, B. O. A general structural equation model with dichotomous, ordered categorical
and continuous latent indicators. Psychometrika, [S.l.], n. 49, 115-132, 1984.
SANTOS, L. M. dos et al. Determinantes do desenvolvimento cognitivo na primeira infncia:
anlise hierarquizada de um estudo longitudinal. Cadernos de Sade Pblica, Rio de Janeiro,
v. 24, n. 2, 427-437, fev. 2008.
47
48