Curso Stata SEM Jose A Martinez Diciembre 2012 UPCT

Curso de introducción
práctica a las ecuaciones

estructurales con Stata
Jose A. Martínez
10, 11, 12 diciembre 2012
Universidad Politécnica de Cartagena
Curso de introducción práctica a los modelos de ecuaciones estructurales con Stata – Jose A. Martínez- UPCT
Sesión 1
Introducción, recordatorio de regresión

lineal y conceptos previos
Tema Tema 2práctica Tema
Curso1de introducción 3
a los modelos Tema
de 4
ecuaciones Ecuaciones
estructurales conbásicas
Stata – algebraicas
Jose A. Martínez- UPCT
- Recordatorio
E ( xi ) = ∑ pi xi
i
E (axi ) = aE ( xi ) si a =cte
E (a + xi ) =a + E ( xi )
E (a) = a
=
Var ( x) E ( x 2 ) − E ( x) 2
Var ( x + =
y ) Var ( x) + Var ( y ) + 2Cov( x, y )
Cov( x, y ) =E [ ( x − E ( x))( y − E ( y ) ]
Cov( x, a ) = 0
Cov(ax, y ) = aCov( x, y )
Cov( x, x) = Var ( x)
Cov( x, y= + z ) Cov( x, y ) + Cov( x, z )
Jose Antonio Martínez García
Modelos causales con LISREL Enero 2007
¿Qué es una variable aleatoria? (Hayduk, 1987)

Random reflects the single hypothetical random selection grounding the probability
Variable refers to the dimension underlying the particular set of values
Aquí tenemos ya el primer escollo sobre el concepto de aleatoriedad en una

variable. ¿Son las variables que utilizamos aleatorias? Por ejemplo, si estoy midiendo
la estatura de los hombres en España, y registro en primer lugar la estatura de un
amigo, yo no puedo predecir exactamente qué valor tendrá. Necesito conocer la
distribución de estatura en la población para saber la probabilidad, es decir, asignar
a cada valor posible una probabilidad. Pero si no conozco esa distribución a
priori…¿necesito realizar experimentos aleatorios?
¿Quiere esto decir que necesito que el muestreo sea aleatorio? Ya veremos
posteriormente que SEM no necesariamente trabaja con muestras aleatorias
¿Qué es una variable aleatoria? (Kaltenbach, 2011)
These are functions mapping an outcome to a number. The advantage of working
with random variables instead of events comes from the fact that random variables
have a probability distribution that describes the probability that the random
variable takes a value smaller or equal to a certain number
Intuitivamente podemos decir que una variables es aleatoria cuando sus valores
dependen del resultado del experimento. Cada vez que el experimento se realiza el
valor de la variable aleatoria puede ser distinto.
•¿Qué es una variable aleatoria? (Krishnamoorthy, 2006)

Random experiment: An experiment whose outcomes are determined only by chance
factors
•Sample space: The set of all possible outcomes of a random experiment
•Event: The collection of none, one o r more than one outcomes form a sample
space
•Random variable: A variable show numerical values are determined by chance
factors. Formally, it is a function from the sample space to a set of real numbers..
¿Qué es una relación entre 2 variables? (Hayduk, 1987)
A relationship exists between 2 variables if the distribution of the cases on

the values of one variable differs, depending on which value of the other
variable the cases possess (ver ejemplo pizarra con la estatura entre
hombres y mujeres)
¿Qué es una covarianza? (Hayduk, 1987)
The covariance between X and Y is defined and calculated as the expected

value (average size) of the product of the deviations of the X and Y scores
from their respective means
Cov(XY)=E(X-E(X))(Y-E(Y)))
For independent X and Y, the covariance
is zero. The converse, however, is not true
x1 x2 x1 x2
1 1 1 1
2 4 2 4
3 9 1 2
4 16 2 4
5 25 1 3
6 36 2 4
7 49 1 4
Diferencia entre estos 2 casos en 8 64 2 4
9 81 1 5
cuanto a relación y covarianza 10 100 2 4
11 121 1 6
12 144 2 4
13 169 1 7
14 196 2 4
15 225 1 8
16 256 2 4
17 289 1 9
18 324 2 4
19 361 1 10
20 400 2 4
cov 698,25 cov -0,38
corr 0,97 corr -0,35
Modelo de regresión múltiple (sencillo para empezar)
yi f ( xik ) + ui
hay que postular asunciones sobre ui
E (ui ) = 0
Distribución de probabilidad de ui
Cov( x, u ) = 0
α + ∑ γ k xik + ui
yi =
Diferentes métodos de estimación (OLS, ML)
Se suele utilizar OLS por su sencillez y robustez

y x1 x2 yest x1est x2est

1 1 1 -1,61 -1,11 -0,97
2 4 2 -1,44 -1,09 0,97
3 9 1 -1,27 -1,05 -0,97
4 16 2 -1,10 -1,00 0,97
5 25 1 -0,93 -0,93 -0,97
6 36 2 -0,76 -0,84 0,97
7 49 1 -0,59 -0,74 -0,97
8 64 2 -0,42 -0,62 0,97
9 81 1 -0,25 -0,49 -0,97
10 100 2 -0,08 -0,34 0,97
11 121 1 0,08 -0,18 -0,97
12 144 2 0,25 0,00 0,97
13 169 1 0,42 0,20 -0,97
14 196 2 0,59 0,41 0,97
15 225 1 0,76 0,64 -0,97
16 256 2 0,93 0,88 0,97
17 289 1 1,10 1,14 -0,97
18 324 2 1,27 1,41 0,97
19 361 1 1,44 1,70 -0,97
20 400 2 1,61 2,01 0,97
10,50 143,50 1,50 0,00 0,00 0,00
5,92 127,90 0,51 1,00 1,00 1,00
. regress y1 x1 x2
Source SS df MS Number of obs = 20

F( 2, 17) = 142.05
Model 627.45509 2 313.727545 Prob > F = 0.0000
Residual 37.5449102 17 2.20852413 R-squared = 0.9435 Capacidad predictiva
(Ssmodel/Sstotal)
Adj R-squared = 0.9369
Total 665 19 35 Root MSE = 1.4861 Raíz cuadrada de la
varianza de los residuos
y1 Coef. Std. Err. t P>|t| [95% Conf. Interval] Depende de la varianza del
error, de la variación
x1 .0449102 .0026751 16.79 0.000 .0392662 .0505542 muestral en esa variable y
de las relaciones lineales
x2 .0568862 .6669788 0.09 0.933 -1.350316 1.464088 de las covariables
_cons 3.97006 1.092717 3.63 0.002 1.664629 6.275491 (Wooldridge, 2002). Para
que sea lo más pequeño
posible nos interesa que la
varianza del error sea
pequeña, haya gran
variablidiad en esa
. regress y1est x1est x2est
covariable y poca
colinealidad
F( 2, 17) = 140.62
Model 17.9631798 2 8.98158988 Prob > F = 0.0000
Residual 1.08582058 17 .063871799 R-squared = 0.9430
Total 19.0490003 19 1.00257897 Root MSE = .25273
y1est Coef. Std. Err. t P>|t| [95% Conf. Interval]

Iguales que los coeficientes
estandarizados del ejemplo
x1est .9712622 .0581505 16.70 0.000 .8485754 1.093949 anterior. Es lo que muchos
reportan en SEM, pero cuidado
x2est .0055222 .0584667 0.09 0.926 -.1178317 .128876 con la interpretación
_cons 2.17e-09 .0565119 0.00 1.000 -.1192296 .1192296
Ejercicio 1
-Estimar un modelo de regresión en desviaciones sobre la media y comparar

los resultados con los ejemplos anteriores (abrir archivo Ejercicio 1 con
Stata)
- sum
- gen y_desv=y-10.5
- gen x1_desv=x1-143.5
- gen x2_desv=x2-1.5
- regress y_desv x1_desv x2_desv
- regress y_desv x1_desv x2_desv, beta
-¿ Qué conclusiones sacamos sobre el valor de los coeficientes y de los

coeficientes estandarizados? Realizar el mismo análisis de regresión usando
ventanas.
- SEM suele trabajar (no siempre) con variables en desviaciones sobre la media
- Por tanto, no hay término constante en el modelo (cuidado con la interpretación de

los coeficientes, ya que ya no vale lo de “cómo cambia y cuando x se incrementa en
1 unidad”)
- SEM trabaja con relaciones lineales (aunque también se pueden emplear modelos
más complejos no lineales, pero pueden dar problemas de estimación).
- En SEM el Rcuadrado sólo es interpretable si el modelo se ajusta (lo veremos

posteriormente). Esto conlleva implicaciones filosóficas y metodológicas muy
importantes. Es preferible un Rcuadrado bajo en un modelo ajustado que un
Rcuadrado alto en un modelo que no se ajusta
Wooldridge (2002). Introducción a la econometría. Un enfoque

moderno. Thompson.
- La mayoría de los datos son de naturaleza no experimental, por lo que

establecer relaciones causales es todo un reto.
- OLS: supuesto clave el de cov(x,u)=0, lo que se conoce como exogeneidad, y

hace que los parámetros sean insesgados. La normalidad de los errores no es
necesaria para que OLS sea válido, sólo nos ayuda a construir intervalos de
confianza. OLS y ML son equivalentes cuando ocurre el supuesto de normalidad.
Cuando la homocedasticidad se viola, entonces hay que usar WLS o calcular los
errores estándar de manera robusta.

moderno. Thompson.
Asumimos también una muestra aleatoria, no colinealidad perfecta (a medida que

aumenta la colinealidad se incrementa la varianza de los estimadores, por lo que
son menos fiables) y que no se omiten variables relevantes. La omisión de
variables relevantes sesga el estimador, salvo que esas variables no covaríen con
los predictores incluidos en el modelo. También se asume fiabilidad perfecta de
los predictores, es decir, no existencia de errores de medida (se puede corregir
más o menos fácil con sólo un predictor, pero en casos de más de un predictor,
se complica mucho la corrección por fiabilidad).

moderno. Thompson.
- ¿Q u é h a cer cu a n do se in cu m plen su pu esto s?
- Violación de homocedasticidad: Recordemos que homocedasticidad significa que la

varianza del error no observable condicionada a las variables explicativas es
constante. Si no se cumple el supuesto debemos de calcular los errores estándar
robustos (lo hace Stata por nosotros). Ojo porque necesitamos muestras grandes para
esto, ya que si no es así, el estadístico t puede no tener la distribución t. Por eso en
muestras más pequeñas, una forma de obtener los errores estándar es a través de
bootstrapping. El contraste para detectar heterocedasticidad en Stata es el de
Breusch-Pagan o el de White. Otra opción es realizar OLS con a través de la
ponderación por la inversa de la varianza de las variables (WLS).

moderno. Thompson.
¿Q u é h a cer pa ra estu dia r em pírica m en te la m a la especifica ció n ?
- Test RESET, que Stata lo hace fácilmente, en el que se incluyen valores

cuadráticos de los valores predichos por el modelo y se estudia la significación
de su coeficiente asociado.
- Si tenemos varios modelos candidatos, Wooldridge (2002) recomienda el

contrastes basados en construir un modelo global a partir de los modelos
candidatos y estudiar la significación de los coeficientes asociados a esos
modelos por separado. Otra opción es comparar estadísticos como AIC o BIC, o
mirar el R-cuadrado, valorar la teoría que hay detrás, etc.

moderno. Thompson.
- E rro r de m edida en la s co va ria bles: El error de medida en las

covariables es un problema para la estimación de los parámetros, sobre todo cuando
ese error es importante (lo que es común cuando se miden conceptos abstractos). En
presencia del error de medida, la estimación OLS es sesgada por atenuación, es decir,
el coeficiente es más bajo de lo que realmente es. Esa atenuación depende la
fiabilidad de la medición de esa variable. Cuanto menos fiable sea, más se atenuará
el coeficiente. En Ree y Carreta (2006) se pueden ver de manera sencilla las
consecuencias del error de medida en estadísticos muy al uso, y como corregirlo. En
Smith y Hunter (1996) puede verse que la ausencia de fiabilidad total en las
mediciones en ciencias sociales es prevalente. En Cronbach y Meehl (1955) también
se describe aspectos esenciales de la fiabilidad. observada. Cuando este ratio se
acerca más a 1, la medida es más fiable.

moderno. Thompson.
- E rro r de m edida en la s co va ria bles:
Básicamente, y asumiendo que la covarianción entre el error de medida y la

varianza observable es cero, entonces la varianza real de una variable es la
suma de la observada más el error. La fiabilidad entonces se entiende como
el ratio entre la varianza real y la observada. Cuando este ratio se acerca
más a 1, la medida es más fiable.
moderno. Thompson.
¿Q u é o cu rre co n la s o bser va cio n es a típica s y la s

o bser va cio n es in flu yen tes?
- Hay que plantearse si esas observaciones provienen de la misma población

o de una diferente, para incluirlas o no en el análisis. Wilcox (2010) da
orientaciones claras sobre cómo quitarse de en medio los datos atípicos,
descontando los percentiles extremos de la distribución de datos (de ambos
lados, se entiende). Wooldridge (2002) no aboga por evaluar las observaciones
atípicas sobre los residuos ya estimados.
- Otras opciones, son por ejemplo regresión robusta a través de la

minimización de la suma de los errores absolutos, que es un estimador M) o
la regresión por quantiles, por ejemplo.
L en g u a je m a tricia l
Suma de matrices: sólo matrices del mismo tamaño pueden sumarse o

restarse
La multiplicación por un escalar no afecta al tamaño de la matriz
La multiplicación de matrices sólo puede hacerse si el número de filas de la

primera matriz es igual al número de columnas, y siempre da como
resultado una tercera matriz cuyas filas son las de la primera matriz y
columnas las de la segunda. La multiplicación no es conmutativa
L en g u a je m a tricia l
¿Q u é es u n a m a triz de co va ria n za s?
Es una matriz 1/n(XX’) donde X son las desviaciones sobre la media de n

individuos sobre m variables. Así, una matriz de covarianzas de 2 variables
sobre 400 individuos no es más que una matriz de 2x2, donde en la
diagonal principal están las varianzas y fuera de ella las covarianzas.
In versió n de m a trices:
Una matriz multiplicada por su inversa resulta en una matrix identidad (ceros en
todos sus elementos salvo unos en la diagonal principal). El problema está en
cómo calcular la inversa de un matriz (diversos métodos aprendidos en el
Instituto…)
Cuando una fila o columna de una matriz es linealmente dependiente de otra,

entonces no se puede obtener una matriz identidad, ya que siempre aparece un
cero en la diagonal principal.
El determinante de una matriz es un escalar que es únicamente definido para

esa matriz.
Dada una matriz cuadrada A de orden n, definimos el adjunto de un elemento aij

de A como el numero:
Aij = (−1)i+j ・Mij
es decir, no es más que el menor complementario correspondiente acompañado de

un signo más o menos dependiendo de la fila y la columna en la que se encuentre
el elemento en cuestión.
Dada una matriz cuadrada A de tamaño n se define su determinante como la suma

del producto de los elementos de una línea cualquiera de la matriz (fila o columna)
elegida, por sus correspondientes adjuntos.
Propiedad: Una matriz cuadrada A tiene inversa ⇐⇒ |A| distinto de 0.
Además, en este caso, la matriz inversa de A, A−1 se calcula de la manera:

A−1 =(Adj(A)t|A|
a los modelos Tema
de 4
ecuaciones estructurales La
concausalidad
Stata – Joseprobabilística
A. Martínez- UPCT
La causalidad debe ser planteada de forma cualitativa
SEM es una metodología utilizada para huir desde la causalidad cualitativa (ej. El
barro no causa la lluvia) hacia la causalidad cuantitativa (ej. La lluvia causa que
el cultivo crezca). Todo lo que hace SEM es derivar la última de la primera a
partir de unas asunciones causales, las cuales se refieren a cualquier asunción
que es usada en un estudio que no puede ser derivada de los datos solamente,
incluso cuando el número de muestra crece indefinidamente. Por ejemplo, que el
barro no causa la lluvia, es decir, que las conclusiones son válidas si las
asunciones son validas.
No obstante existen algoritmos para “descubrir” relaciones causales (IC, TETRAD).

Mucho cuidado con ellos, se aconseja no olvidar las asunciones cualitativas
a los modelos Tema
de 4
concausalidad
A. Martínez- UPCT
- M o delo s ca u sa les
-Modelos funcionales  ecuaciones funcionales deterministas y asignación de aleatoriedad
a las variables no incluidas en el modelo
- Pearl (2000) define las ecuaciones estructurales de la siguiente forma: “Una ecuación
y=βx+u se dice que es estructural si es interpretada como sigue: En un experimento
ideal donde contralamos X a x y cualquier otro conjunto de variables Z (que no contienen
X o Y) a z, el valor de y de Y es dado por βx+u, donde u no es una función de los
conjuntos x y z”.
- La elucidación causal de la ecuación reside en el coeficiente β, el cual es interpretado
por Pearl (2000) como el valor de cambio en la esperanza de y, E(y), cuando x cambia en
una unidad. Pearl habla de la palabra “cambio” y no de la “expectativa condicionada”. Es
decir, si se tuvieran los medios físicos para fijar el valor de x a algún valor constante x1,
y cambiar esa constante de x1 a x2, entonces el cambio observado en E(y) sería β(x2-x1).
Problema: Filosofía de “ceteris paribus” cuando los predictores no son ortogonales.
Tema
Curso Tema
1de introducción
Fiabilidad 2práctica Tema
en ciencias 3
a los modelos
sociales Tema
de 4
concausalidad
A. Martínez- UPCT
Durvasula, S., Sharma, S. y Carter, K. (2012). Correcting

the t statistic for measurement error. Marketing Letters.
Peterson (1994) performed a meta-analysis of Cronbach’s alpha, which is an
indicator of scale reliability, and found that the mean coefficient alpha is no greater
than 0.76 in marketing-related journals and 0.77 in psychology-related journals. In a
quarter of the studies featuring consumer samples, coefficient alpha was actually
0.66 or less. In an earlier study, Churchill and Peter (1984) reported a mean
coefficient alpha of 0.75 in marketing studies. It is not uncommon to find studies
that report reliability estimates that are close to the Nunnally’s (1978) minimum
recommended value of 0.7 or even 0.6 which is considered adequate by some
(Diamantopoulos and Siguaw 2000; Malhotra 2007). Judging from previous research, it
is clear that measurement scales are unlikely to be perfectly reliable (i.e., alpha
<1) and that measurement error continues to be a major issue.

Tema
Curso Tema
1de introducción
Fiabilidad 2práctica Tema
en ciencias 3 (continuación)
a los modelos
sociales Tema
de 4
concausalidad
A. Martínez- UPCT
The key question then is how to design error-free measures? There is no

conclusive evidence as to how to design totally error-free measures. Meta-
analysis studies by Churchill and Peter (1984) and Peterson (1994) found moder-
ate relationship between reliability and scale length. This result is not surprising, as
the reliability of a scale certainly increases as the number of scale items increase, as
long as the average inter-item correlation remains the same. But Drolet and Morrison
(2001) show that as more items are added to the scale, the amount of information
gained from each additional scale item becomes minimal, negating the benefits of
having longer scales. There is also evidence to suggest that longer scales can threaten
construct validity (Churchill and Peter 1984), lead to respondent fatigue (Drolet and
Morrison 2001), and can even change judgments about the underlying construct
(Kardes et al. 1993). In some cases, high alpha values may indicate that respondents
perceive duplication of items. Hence, Drolet and Morrison (2001) as well as Kardes et
al. (1993) argue for using shorter scales, while Bergkvist and Rossiter (2007)
advocate using single-item scales for certain concrete constructs.
Sesión 2
Primeros pasos con SEM y Stata

a los modelos Tema
de 4
ecuaciones Filosofía de
estructurales conajuste.
Stata – Modelado estadístico
Principios del modelado estadístico
Datos = Modelo + Error
Selección
Ajuste Proceso de modelado

Modelos estadístico
Evaluación
Interpret.
- Proponer un modelo que explique los datos con el menor error posible
Modelos causales con LISREL
- El modelo es el componente determinista y el error es el estocástico Enero 2007
a los modelos Tema
de 4
ecuaciones Filosofía de
estructurales conajuste.
Stata – Modelado estadístico
Evaluación del modelo (Ato y López, 1996)
-Criterio de la parsimonia (Navaja de Occam o principio de la pluralidad

innecesaria). El modelo aceptado debe ser suficientemente simple para explicar el
complejo mecanismo subyacente. Los modelos simples tienen mayor grado de
falsabilidad
-Criterio de la bondad de ajuste
-Criterio de la integración teórica (valores congruentes de parámetros, etc.)
-En SEM los metodólogos discuten acerca de la adecuación al criterio de la

parsimonia
-La bondad del ajuste es discutida en base a un debate entre criterios exactos
(chi-cuadrado) y criterios aproximados (ej. RMSEA).
-La bondad del ajuste no se refiere a la capacidad explicativa del modelo!!!!
-Aunque todos los criterios se cumplan el modelo puede estar causalmente mal
especificado!!! Jose Antonio Martínez García
a los modelos Tema
de 4
concausalidad
A. Martínez- UPCT
- Ideas importantes sobre causalidad

Precedencia temporal. Asimetría causal.
Relación funcional
No existencia de correlación espuria
Cuidado con la heterogeneidad no observable!!!

Interpretación de los resultados: El comportamiento humano es al mismo
tiempo determinado y libre. Mucho cuidado con el valor explicativo de los
modelos!!
Cuidado con las herramientas estadísticas. En este tipo de investigación se
pueden cometer los “4 errores”:
-Error Tipo I (tamaño del test)
-Error Tipo II (baja potencia)
-Error Tipo
Modelos III (tamaños
causales de efecto con sentido equivocado)
con LISREL
-Error Tipo IV (utilización de las herramientas estadísticas erróneas)
-¿Qué es SEM?
-Strutural Equation Modeling, Modelos de Ecuaciones Estructurales basados en

estructuras de covarianza entre datos empíricos. Es una herramienta metodológica
para cuantificar relaciones causales
-La metodología SEM ha dominado el análisis causal en las ciencias sociales y

del comportamiento desde los años 60 (Pearl, 1998). SEM es un lenguaje para la
causalidad desarrollado por genéticos (Wright, 1921) y economistas (Haavelmo,
1943; Koopmeans, 1950), de tal modo la que información cualitativa sobre causa-
efecto podría ser combinada con datos estadísticos para proveer una evaluación
cuantitativa de las relaciones causa efecto entre las variables e interés
VULGARMENTE: SEM ES COMO LA REGRESIÓN, PERO YENDO MÁS

ALLÁ DE LA PALABRA ASOCIACIÓN “E(Y|X) E(X|Y))”, PARA
LLEGAR A LA INTERVENCIÓN “E(Y|D0(X))”
-Algunas fortalezas de SEM

- Permite diferentes tipos de análisis: Ej. Regresión lineal, análisis factorial
exploratorio, análisis factorial confirmatorio, análisis multigrupo, análisis de la
varianza, y otros muchos más
-Indicado para todo tipo de diseños: experimentales, transversales, longitudinales
-Permite plantear modelos con múltiples variables dependientes y testarlos en una

única estimación
-Puede operar con variables latentes, lo que permite contar con el error de medida
en la estimación de los coeficientes estructurales
-Puede usar variables continuas, ordinales o dicotómicas (excepciones)

-Métodos de estimación paramétricos y no paramétricos
-Algunas debilidades de SEM

- Requiere amplios conocimientos metodológicos. Mucho riesgo de usos inadecuados.
Hay que programar y no es fácil para principiantes.
-Las variables dependientes no pueden tener naturaleza dicotómica (en las

aplicaciones habituales relacionadas con los modelos de regresión)
-Aunque permite plantear relaciones no lineales, el hecho de utilizar variables

latentes dificulta bastante su uso
-Requiere amplios tamaños muestrales. ¡El test de la chi-cuadrado es un test

asintótico!
-Hay fortísimas confrontaciones entre metodólogos sobre diversos aspectos de SEM,

por lo que existe división en la comunidad científica y el investigador tiene que
posicionarse por una de las diferentes corrientes
a los modelos Tema
de 4
ecuaciones Planteamiento
estructurales algebraico
con Stata de SEM UPCT
– Jose A. Martínez-
-Variables latentes
Tal y como indican MacCallum y Austin (2000) las variables latentes son
constructos hipotéticos que no pueden ser directamente medidos. Es decir, se
manifiestan a través de una serie de indicadores observables que, como
revela Bollen (2002), son localmente/condicionalmente independientes y
definen el valor esperado de la variable latente, la cual es una función no
determinista de esos indicadores.
Permiten tener en cuenta el error en la medición (cubre algunas limitaciones
de la regresión)

a los modelos Tema
de 4
- El modelo de factor
Quiero conocer si las covarianzas

ε1 entre los indicadores observables
pueden ser explicadas por el efecto
de una causa común
x1 λ11ξ1 + δ1
=
λ11 λ21 λ31
x1 x2 x3
λ41
x4
x2 λ21ξ1 + δ 2
=
x3 λ31ξ1 + δ 3
=
δ1 δ2 δ3 δ4
x4 λ41ξ1 + δ 4
=
X =Λξ + δ
a los modelos Tema
de 4
- El modelo de factor
Var ( x1 ) λ112 Var (ξ1 ) + Var (δ1 )

= Σ x =Σˆ x [ λ ;Var (ξ );Var (δ ) ]
Var ( x2 ) λ 212 Var (ξ1 ) + Var (δ 2 )
= Σ x =ΛΦΛ t +Θ
Var ( x3 ) λ312 Var (ξ1 ) + Var (δ 3 )
=
Var ( x4 ) λ 412 Var (ξ1 ) + Var (δ 4 )
= Ecuaciones diferentes: p(p+1)/2
Cov( x1 x2 ) = λ11 λ 21Var (ξ1 ) Parámetros a estimar: ¿?
Cov( x1 x3 ) = λ11 λ31Var (ξ1 )

¿Está identificado el modelo?
Cov( x1 x4 ) = λ11 λ 41Var (ξ1 ) Es decir, ¿tenemos suficiente
información en la matriz de datos
Cov( x2 x3 ) = λ 21 λ31Var (ξ1 ) para obtener una solución única de
Cov( x2 x4 ) = λ 21 λ 41Var (ξ1 ) los parámetros?
Cov( x3 x4 ) = λ31 λ 41Var (ξ1 )

Ejercicio 2 práctica a los modelos de ecuaciones estructurales con Stata – Jose A. Martínez- UPCT
Ejercicio 2
-Estimar el modelo de factor anterior con Stata
- Abrir Excel (Ejercicio 2) y comprobar los códigos de los perdidos
- Cerrar Excel e importar desde Stata con cuidado con las filas (otra opción es
copiar/pegar)
- Summarize con Stata siempre como chequeo inicial

-Estimar SEM
-sem (p19<-X@1) (p20<-X) (p21<-X) (p22<-X)
-sem (p19<-X@1) (p20<-X) (p21<-X) (p22<-X), method(mlmv)
-sem (p19<-X@1 _cons@0) (p20<-X _cons@0) (p21<-X _cons@0) (p22<-X

_cons@0), method(mlmv)
-Discutir los resultados en clase
-¿Qué pasa con el término constante? ¿Cuál es el ajuste del modelo? ¿Qué
ocurre con los casos perdidos? ¿Significación parámetros)
-Ejercicio 3
-Ejercicio para casa: Estimar el mismo modelo con los datos en desviaciones
sobre la media
-Comprobar la matriz de covarianzas estimada (implicada por el modelo) con la

real
Sesión 3
Análisis factorial confirmatorio y

regresión múltiple con SEM y Stata
a los modelos Tema
de 4
- El modelo de factor (análisis factorial confirmatorio)
Φ21
ε1 ε2
x1 x2 x3 x4 x5 x6 x7 x8 x9
δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8 δ9

-Ejercicio 4
-Estimar el modelo anterior
-1. Escoger los ítems (ej. 4 ítems de calidad percibida y 5 de satisfacción)

- 2. Especificar el modelo con Stata
- 3. Opción de fijar la fiabilidad de uno o varios indicadores
- sem (p19<-X1@1) (p20<-X1) (p21<-X1) (p22<-X1) (p23<-X2@1) (p24<-

X2) (p25<-X2) (p26<-X2) (p27<-X2), reliability(p19 0.9) reliability(p23 0.9)
-estat framework, standardized
-¿Interpretación de estos resultados? ¿Qué significa fijar la fiabilidad de un

indicador?
- Hacer lo mismo fijando los intercepts a 0
a los modelos Tema
de 4
- El modelo causal
γ11
ε1 η1 ζ1
λx11 λx21 λx31 λx41 λy11
x1 x2 x3 x4 y1
δ1 δ2 δ3 δ4 ε5

a los modelos Tema
de 4
- El modelo causal
x1 λ11x ξ1 + δ1
=
x2 λ 21x ξ1 + δ 2
=
Modelo de medida
x3 λ31 ξ1 + δ 3
= x
x4 λ 41x ξ1 + δ 4
=
y1 λ11yη1 + ε1
=
η1 γ 11η1 + δ1
= Modelo “estructural”
X =Λ xξ + δ
Y= Λ yξ + ε
η =Γξ + ζ
a los modelos Tema
de 4
-Regresión en diagramas SEM
-Regresión (estimación OLS)
γ
CAL LEA
0,53
1 1
x1 y1
0 0

a los modelos Tema
de 4
-Ejercicio 5
-1. Escojo p19 (calidad) y p28 (lealtad)

-2. Regresión normal
. regress p28 p19, beta

F( 1, 200) = 78.99
Model 70.4502157 1 70.4502157 Prob > F = 0.0000
Residual 178.386418 200 .89193209 R-squared = 0.2831
Total 248.836634 201 1.2379932 Root MSE = .94442
p28 Coef. Std. Err. t P>|t| Beta
p19 .636162 .0715801 8.89 0.000 .5320887

_cons 1.361051 .2112872 6.44 0.000 .

a los modelos Tema
de 4
-3. Estimación SEM
sem (p19<-X1@1) (p28<-X2@1) (X2<-X1), reliability (p19 0.99)

reliability (p28 0.99)
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
X2 <-
X1 .642588 .0719472 8.93 0.000 .501574 .7836019
Measurement
p19 <-
X1 1 (constrained)
_cons 2.80198 .0653164 42.90 0.000 2.673962 2.929998
p28 <-
X2 1 (constrained)
_cons 3.143564 .0780918 40.25 0.000 2.990507 3.296622
Variance
e.p19 .0086178 (constrained)
e.X2 .8672588 .0878752 .7110506 1.057784
X1 .8531604 .0857501 .7006118 1.038924

Modelos
LR test of causales con LISREL
model vs. saturated: chi2(0) = 0.00, Prob > chi2 = .
Enero 2007
a los modelos Tema
de 4
γ1 0,27
CAL LEA
1 γ2 1
0,4
9
x1 SAT y1
1
0 0
x2

a los modelos Tema
de 4
-Ejercicio 6
-1. Elegir los indicadores para las 3 variables latentes (calidad,

satisfacción y lealtad)
-2. Fijar la fiabilidad de cada indicador
-3. Estimar
-sem (p19<-X1@1) (p23<-X2@1) (p28<-Y1@1) (Y1<-X1 X2),

reliability (p19 0.8) reliability (p28 0.8) reliability (p23 0.8)
--4. Interpretar resultados

a los modelos Tema
de 4
Structural equation model Number of obs = 202

Estimation method = ml
Log likelihood = -748.00176
( 1) [p28]Y1 = 1
( 2) [p19]X1 = 1
( 3) [p23]X2 = 1
( 4) [var(e.p19)]_cons = .1723557
( 5) [var(e.p23)]_cons = .1612832
( 6) [var(e.p28)]_cons = .2463729
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
Y1 <-
X1 .2795202 .1271798 2.20 0.028 .0302523 .5287882
X2 .7769259 .1326244 5.86 0.000 .5169868 1.036865
Measurement
p19 <-
X1 1 (constrained)
_cons 2.80198 .0653164 42.90 0.000 2.673962 2.929998
p23 <-
X2 1 (constrained)
_cons 3.410891 .0631835 53.98 0.000 3.287054 3.534729
p28 <-
Y1 1 (constrained)
_cons 3.143564 .0780919 40.25 0.000 2.990507 3.296622
Variance
e.Y1 .3434631 .0697178 .2307273 .5112826
X1 .6894226 .0857501 .5402731 .8797467
X2 .6451328 .0802414 .505565 .8232302
Covariance

X1
Modelos
X2
causales
.4576022
con 6.84
.0669103
LISREL
0.000 .3264604 .588744
Enero 2007
LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = .
Sesión 4
Estimación, identificación, bondad de

ajuste y asunciones
a los modelos Tema
de 4
- Hasta ahora hemos estimado modelos sin preocuparnos por el método de

estimación, la bondad del ajuste y las asunciones que se han de cumplir. Esto
es esencial para que un modelo sea válido y así poder realizar una correcta
interpretación
- SEM parte de una matriz de covarianzas entre los indicadores observables.

Esa matriz se compara con la matriz de covarianzas implicadas por el
modelo, la cual resulta de las restricciones de causalidad que estemos
imponiendo. Esa matriz implicada por el modelo es la matriz poblacional,
porque estipulamos que ése es el modelo que rige la población.

a los modelos Tema
de 4
-La bondad de ajuste del modelo cuantifica la magnitud de la distancia entre

las dos matrices de covarianza, es decir, da una idea sobre la importancia de
los residuos.
-Cuanto más pequeños sean los residuos, mayor será el ajuste, porque ambas
matrices concuerdan en mayor medida.
-Sin embargo, hay que tener mucho cuidado con estas directrices generales,
porque un solo residuo muy grande puede provocar el mismo efecto sobre el
ajuste que muchos residuos pequeños.

a los modelos Tema
de 4
- Maximizar la verosimiltud significa minimizar lo atribuible a las meras

fluctuaciones muestrales. Es decir, buscamos los estimadores más verosímiles dados
los datos, o lo que es lo mismo, los que tienen más probabilidad de ser reales
dados los datos.
-Recordemos que se trata de maximizar la “probabilidad “ (verosimilitud) de los

parámetros dados los datos. Eso es conocido como verosimilitud y es diferente a lo
que se hace, por ejemplo al testar una hipótesis nula por la vía frecuentista (en
este caso se evalúa la probabilidad de los datos dada la hipótesis nula)
-En realidad no se maximiza la verosimilitud, sino el logaritmo de la verosimilitud

(por motivos de facilidad de cómputo). El resultado no varía, porque el máximo del
logartimo de la función es el máximo de la función normal.

a los modelos Tema
de 4
- A la hora de comprar modelos en función del valor de logaritmo de la función

de verosimilitud, hay que destacar que un mayor valor de ésta no quiere decir
que el modelo represente mejor la realidad (por ejemplo, puede ser porque sea un
modelo que utilice más variables, es decir, más parámetros). Por ello se usan otros
índices como AIC o BIC, como criterio de comparación. Pero nunca una estimación
nos va a decir si nuestro modelo es el que refleja la realidad o no. Para afirmar
eso, hay que tener en cuenta otras cosas (teoría, capacidad predictiva,
generalizabilidad, etc.)

a los modelos Tema
de 4
- Maximizar el logaritmo de la función de verosimilitud significa minimizar el

valor de la función de verosimiltud, porque el logaritmo entre 0 y 1 es siempre
negativo. Por eso los valores que da Stata son negativos.
-La estimación por Máxima Verosimilitud requiere de la asunción de normalidad

multivariante, lo que significa que las variables tienen que ser normales
univariantes y además, satisfacer otra serie de condicionantes en cuanto a su
relación bivariada, trivariada, etc. Es una asunción muy restrictiva y que muy
pocos datos la cumplen.

a los modelos Tema
de 4
- Si los datos vienen de una normal multivariante y una muestra de N

individuos se selecciona con matriz de covarainzas Σ, se puede escribir la
densidad de probabilidad de que una muestra con matriz de covarianzas S
apareciera. Es lo que se conoce como distribución Wishart, que muestra la
verosimilitud de encontrar una matriz S.
- Por tanto, no se utilizan los datos brutos para obtener los parámetros
estimados y el ajuste del modelo, sino que se parte de la matriz de covarianzas,
y se asume que esa matriz sigue una distribución Wishart, es decir, que ha sido
generada a partir de una normal multivariante con media cero y matriz de
covarianzas Σ. La normal multivariante con media cero nos ayuda a entender el
por qué se toman los valores de los datos brutos en desviaciones sobre la media
(como hacen programas como LISREL)
a los modelos Tema
de 4
- Debido a la complejidad de la maximizar la función que maximiza el ajuste

entre la matriz de datos y la poblacional, se toma el ratio de verosimiltud como
función a maximizar. El ratio de verosimiltud es el cociente entre la verosimilitud
de un modelo frente a un modelo con ajuste perfecto. Y luego se toman
logaritmos para hacer más fácil la ecuación.
-Finalmente se trata de maximizar la siguiente función:
−𝟎𝟎. 𝟓𝟓𝟓𝟓[𝒕𝒕𝒕𝒕(𝑺𝑺𝚺𝚺−𝟏𝟏) + 𝒍𝒍𝒍𝒍|𝚺𝚺| − 𝒍𝒍𝒍𝒍|𝑺𝑺| − 𝒕𝒕𝒕𝒕(𝑺𝑺𝐒𝐒−𝟏𝟏)]

a los modelos Tema
de 4
-Que es lo mismo que minimizar la función que está dentro de los corchetes (llamada
función de discrepancia). Esta expresión está basada en datos en desviaciones sobre la
media. Para considerar las medias (y así estimar los intercepts) hay que añadir un
vector de medias (es lo que hace Stata por defecto)
-Ayudándonos del álgebra interpretamos que en la medida en que la matriz

poblacional (modelo) difiera de la muestral, la función de discrepancia será mayor, cosa
que no nos interesa en absoluto.
-Por tanto, lo que estamos haciendo es decir: a su m ien do qu e m i m o delo es

verda d, la vero sim ilitu d de qu e la m a triz de co va ria n za s de la
m u estra sea la de la po bla ció n (co n sidera n do el erro r m u estra l), y
co m pa ra da co n la vero sim ilitu d de qu e la m a triz de co va ria n za s
m u estra l sea efectiva m en te la de la po bla ció n , en to n ces o bten go
X X X . E se va lo r deberá “ co rreg irse” pa ra o bten er u n test esta dístico (el
test de la ch i-cu a dra do ) Jose Antonio Martínez García
a los modelos Tema
de 4
- Es sabido que menos dos veces el logaritmo de un ratio de verosimilitud se

distribuye asintóticamente como una variable chi-cuadrado. Esto quiere decir que
se aproxima mejor a una chi-cuadrado a medida que la muestra crece. Con
muestras pequeñas, no tenemos tan claro que se distribuya así, con las
consecuencias que ello tiene.
-Por tanto, y dada la función de discrepancia anteriormente mencionada, el valor

de la chi-cuadrado se obtiene multiplicando ésta por n=N-1.
-De este modo , tenemos un test estadístico que cuantifique la bondad de ajuste
del modelo

a los modelos Tema
de 4
- La hipótesis nula del test es que, si se cumplen las asunciones, la discrepancia

entre ambas matrices de covarianza se debe únicamente a las fluctuaciones
muestrales. Por tanto, lo que queremos es que el test salga no significativo (acepto
la hipótesis nula)
-Por tanto, hay que reflexionar sobre el nivel de significación correcto para
aceptar la hipótesis nula, ya que ésta, tiene un sentido diferente a las de las
habituales sobre test de parámetros. Por ejemplo, para rechazar la hipótesis nula de
igualdad de diferencia de medias, se necesita un probabilidad <0.05, lo que indica
que en menos de 1 de cada 20 muestras habrá un falso positivo. Es decir, una
evidencia fuerte para rechazar una teoría, ya que la probabilidad de los datos
dado Ho es muy pequeña.

a los modelos Tema
de 4
ecuaciones Métodos de
estructurales con estimación
Stata – Jose A. Martínez- UPCT
Existen muchos métodos de estimación en SEM, y pueden variar entre

programas
Algunos ejemplos son los siguientes:
ML
RML
ML y bootstrapping
ULS
GLS
WLS
DWLS
2SLS
Ver archivos “Metodos de estimacion.pdf” “Metodos de estimacion (2).pdf”

a los modelos Tema
de 4
Estimación con Stata
ML: requiere que los datos sean condicionalmente normales

MLMV: requiere completa normalidad multivariante (permite la
consideración casos perdidos)
QML: estima por máxima verosimilitud pero corrige los errores
estándar. Es similar a RML en LISREL
ADF: No requiere asunciones sobre los datos, pero necesita
grandes tamaños muestrales
Ver manual de Stata para una mayor explicación

a los modelos Tema
de 4
Consejos sobre estimación (en otros programas más allá de Stata, como LISREL)
-Si los datos son continuos y aproximadamente normales multivariante, usar ML

con la matriz de entrada CM
-Si son continuos y se desvían un poco de la normalidad, usar RML (la muestra
tieneque ser suficiente para estimar adecuadamente la matriz de covarianzas
asintótica)
-Si son continuos y se desvían muchísimo de la normalidad, usar ML con
Bootstrapping y matriz PM

a los modelos Tema
de 4
Consejos sobre estimación (en otros programas más allá de Stata, como LISREL)
-Si los datos son ordinales, o mezcla de ordinales y continuos, usar DWLS
(muestras moderadas) o WLS (muestras muy grandes) y matriz PM
-ML soporta variables exógenas binarias. Usar matriz CM.
-Cuando se usa CM hay que reescalar varianzas si usamos datos con escalas de
medida muy dispares

a los modelos Tema
de 4
ecuaciones Índices decon
estructurales ajuste
Ín dices de a ju ste del m o delo

-Son necesarios para evaluar la especificación causal
-Es necesaria su evaluación antes de analizar los parámetros estimados
-Un modelo puede tener un ajuste adecuado y estar mal especificado, por lo que
el ajuste no es sinónimo de correcta especificación. La especificación es una
asunción cualitativa.
-Se pueden dar ajustes adecuados con muy bajos R2. La varianza explicada de
las variables endógenas no es un criterio de ajuste

a los modelos Tema
de 4
Ín dices de a ju ste del m o delo

-Sin embargo la varianza explicada de los indicadores sí es tenida en cuenta
junto con los índices de ajuste (relacionado con la teoría clásica de los tests)
-Hay dos corrientes metodológicas claramente enfrentadas sobre la filosofía
de ajuste:
-Ajuste exacto (uso exclusivo de la chi-cuadrado)
-Ajuste aproximado (uso añadido del RMSEA)

a los modelos Tema
de 4
Ajuste exacto
-Ho: modelo se ajusta perfectamente en la población
-Uso del p-valor 0.05 como criterio dicotómico, incluso pretensión de elevarlo a
0.80
-Las asunciones deben ser correctas
-Si existe fuentes de sesgo hay que incluirlas en el modelo
-No sirven la filosofía de Cohen, Meehl y otros sobre la existencia del “crud
factor”, ya que el test del modelo es diferente al test de parámetros
-No existe ningún test estadístico más en SEM. Es incorrecto que modelos que no
se ajustan sigan una chi-cuadrado no central

a los modelos Tema
de 4
Ajuste exacto
-El tamaño de muestra es el criterio de potencia: a mayor N, mayor probabilidad
de detectar una mala especificación
-La ciencia avanza igualmente con modelos que no se ajustan. Se aboga por la
honestidad
-Defensores (unos pocos): Leslie Hayduk, Dale Glasser, Paul Barrett (con matices),
Manuel Ato

a los modelos Tema
de 4
{
 Máx χ 2 − (df / N − 1), 0}
−1 2
Ajuste aproximado RMSEA =  

 df 
-Ho: modelo se ajusta perfectamente en la población es poco realista

-Uso del p-valor 0.05 como criterio dicotómico es una restricción demasiado rígida
-Las asunciones pueden desviarse ligeramente. El modelo es sólo una aproximación
-Permite contar con las fuentes de sesgo no tenidas en cuenta en el modelo
-Los autores defienden los postulados de Cohen, Meehl, etc. Muchos de ellos, como
Jim Steiger, son firmes seguidores del uso del parámetro de no centralidad.
-Se basan en la distribución estadística de la chi-cuadrado no central. Existen
intervalos de confianza

a los modelos Tema
de 4
{
 Máx χ 2 − (df / N − 1), 0}
−1 2
Ajuste aproximado RMSEA =  

 df 
-El tamaño de muestra es también el criterio de potencia, pero también se

cuenta con la parsimoniadel modelo (grados de libertad). Existen tablas de
potencia
-En ciencia se trabaja con aproximaciones (teoría de la tectónica de placas, etc)
-Defensores (casi todos): Stanley Mulaik, Beng Muthén (Mplus), Karl Jöreskog
(LISREL), Peter Bentler (EQS), Jim Steiger (SEPATH), Robert MacCallum, etc.

a los modelos Tema
de 4
Opinión personal
-El investigador debe posicionarse por una u otra postura

-Ambas tienen limitaciones
-La estadística requiere de una interpretación subjetiva en determinados casos
-No hay ninguna forma de conocer el grado de mala especificación causal, por
tanto no existe un “tamaño de efecto” de mala especificación. Problemas con la
analogía en la estimación de parámetros (alpha, beta, tamaño de efecto y tamaño
de muestra)

a los modelos Tema
de 4
Opinión personal
-El test de la chi-cuadrado ya me indica la importancia de los residuos, tiene

una distribución conocida, y es el único test estadístico de SEM.
-El principal problema es que yo no sé con una muestra pequeña y unos
residuos pequeños, si tengo potencia suficiente. Por tanto, SEM es un método
óptimo para muestras grandes y modelos simples.
- Aún queda mucho que razonar
-Analizar detenidamente los archivos “Numero especial de la revista SEM.pdf”
-Ejemplo de artículo que utiliza la corriente del ajuste exacto
“Martínez&Martínez2008 (TM).pdf”

a los modelos Tema
de 4
Importante
Diversos investigadores (Beaducel y Witttman, 2004; Fan y Sivo, 2005;

Marsh et al., 2004) han cuestionado el uso de criterios fijos, o “reglas de
oro” para la evaluación de modelos con índices de ajuste incrementales
(CFI, RNI, TLI, etc) e incluso con índices de ajuste absoluto como el
SRMR o el RMSEA, como respuesta a las reglas de corte propuestas por
Hu y Bentler (1999), que comúnmente son usadas para ajustar los
modelos de forma aproximada.

a los modelos Tema
de 4
ecuaciones Tamaño de
estructurales conmuestra y potencia
- Tamaño de la muestra y potencia
-Efectos sobre la iteración en el método de estimación

-Efectos sobre el error estándar de los parámetros estimados.
-Efectos sobre la consideración asintótica del test de la chi-cuadrado
-Efectos sobre la potencia del contraste de hipótesis
-Efectos sobre la estimación de la matriz de covarianzas asintótica

a los modelos Tema
de 4
ecuaciones Tamaño de
estructurales conmuestra y potencia
- Tamaño de la muestra y potencia
No existen reglas fijas.

Básicamente, hay que cumplir las condiciones asintóticas de la chi-
cuadrado (por lo que muestras menores de 150-200 son poco
recomendables)
Ver los archivos “Boomsma&Hoogland2001.pdf” y “Potencia y

modificacion del modelo.pdf”
Si seguimos la filosofía del ajuste aproximado, MacCalum et al. (1996)

indican cómo usar el RMSEA como criterio de potencia en SEM.
a los modelos Tema
de 4
ecuaciones Identificación
estructurales del modelo
con Stata – Jose A. Martínez- UPCT
Identificación del modelo
- Un principio fundamental es que debe haber las mismas o más ecuaciones

que incógnitas para que el modelo tenga una única solución. Pero en SEM hay
que cumplir algún requisito más
-1. Grados de libertad > 0. “Condición de orden”.Esto significa que hay más
elementos no redundantes en la matriz de covarianzas de entrada que
parámetros a estimar. Modelos con gl=0 son científicamente poco útiles.
Recordar que los mejores modelos son los que tienen mayor grado de
falsabilidad (mayores restricciones causales fijadas a cero)
-2. Cada variable latente debe escalarse. Relacionado con la “condición de

rango”.

a los modelos Tema
de 4
Identificación del modelo
-3. No debe haber dos variables excesivamente correlacionadas (son

prácticamente la misma variable). El podría estar “empíricamente no
indentificado” (Kenny, 1979).
-4. El problema de la identificación en modelos con causalidad recíproca es

distinto (uso necesario de variables instrumentales)

a los modelos Tema
de 4
Escalamiento de variables latentes
Var ( x1 ) λ112 Var (ξ1 ) + Var (δ1 )

= Hay 10 ecuaciones y 9 parámetros a
estimar. Tenemos un grado de libertad
Var ( x2 ) λ 212 Var (ξ1 ) + Var (δ 2 )
=
residual. Entonces por qué la
Var ( x3 ) λ312 Var (ξ1 ) + Var (δ 3 )
= necesidad de escalar la variable
latente? Sencillamente por la
Var ( x4 ) λ 412 Var (ξ1 ) + Var (δ 4 )
= incapacidad algebraica de obtener
una única solución dadas las
Cov( x1 x2 ) = λ11 λ 21Var (ξ1 ) ecuaciones de covarianza.
Cov( x1 x3 ) = λ11 λ31Var (ξ1 )
Cov( x1 x4 ) = λ11 λ 41Var (ξ1 )
1
Cov( x2 x3 ) = λ 21 λ31Var (ξ1 )
=
gl [ k (k + 1)] − θ
2
Cov( x2 x4 ) = λ 21 λ 41Var (ξ1 ) k = rango de la matriz de covarianzas
θ = número de parámetros a estimar
Cov( x3 x4 ) = λ31 λ 41Var (ξ1 )

a los modelos Tema
de 4
Escalamiento de variables latentes
Para el escalamiento de variables latentes se pueden fijar un “lambda” o la

varianza de la variable latente. Es mejor fijar “un lambda” por varias razones
1. Permite desarrollar estrategias de compromiso teórico con el significado de la
variable latente (Hayduk, 1996)
2. Las varianzas no tienen por qué ser iguales (importante en análisis multigrupo
o en diseños longitudinales)
3. Las restricciones de identificación pueden interactuar (Steiger, 2002)
Ampliación: Ver archivos “Identificacion.pdf”“Identificacion (2).pdf”

Consejo final: Re-estimar el modelo utilizando distintos starting values para detectar
problemas de identificación. Jose Antonio Martínez García
Sesión 5
Estimación completa de un modelo de

ecuaciones estructurales
a los modelos Tema
de 4
En esta lección vamos a estimar un modelo de ecuaciones

estructurales poniendo atención en todos los pasos necesarios para la
estimación, el cumplimiento de las asunciones, las alternativas
posibles y la interpretación de los resultados

a los modelos Tema
de 4
- Ejemplo 7 (utilizar SEM builder)
Lealtad 6
Calidad 1
1 p28 p30
0 0
p19 p20
0 0 7 8
Satisfacción 3
1 2
1
p23 p24
0 0
4 5
a los modelos Tema
de 4
-Elección de 2 indicadores por concepto: “first and second

best indicators”
1. Planteamiento del modelo a nivel gráfico
2. Fijación de la fiabilidad del indicador gold estándar
3. ¿Normalidad de los datos?
mvtest normality ….
sktest….
4. Estudio de la bondad del ajuste
5. Consideración de modelos alternativos
6. Interpretación de los parámetros
7. Reespecificación (si es necesario)
a los modelos Tema
de 4
sem (Calidad@1 -> p19) (Calidad -> p20) (Calidad -> Satisfacción)
(Calidad -> Lealtad) (p19 <- _cons@0) (p20 <- _cons@0)
(Satisfacción@1 -> p23) (Satisfacción -> p24) (p23 <- _cons@0)
(p24 <- _cons@0) (Lealtad@1 -> p28) (Lealtad -> p30) (p28 <-
_cons@0) (p30 <- _cons@0), latent(Calidad Satisfacción Lealtad )
reliab(p19 .9 p23 .9 p28 .9 )

a los modelos Tema
de 4
ecuaciones Re-especificación
estructurales con Stata del modelo
– Jose causal
A. Martínez- UPCT
Re-especifia ció n
-Stata da índices de modificación (MI), que indican el cambio en la chi-

cuadrado y en los parámetros al liberar un parámetro restringido a cero.
Permiten evitar errores Tipo II, aunque no hay nada como una muestra
grande para ello
-Los índices de modificación deben ser usados con cautela. Realmente sólo
son útiles en casos en que existe una clara mala especificación en uno o dos
coeficientes, y el programa es capaz de detectarla sin ninguna perturbación.
Es una información parecida a la que dan los residuos.
-Sólo debe re-especificarse un modelo causal en base a la teoría sustantiva.

SEM es un método confirmatorio, y no exploratorio. No nos guiemos por lo
que vemos en algunas revistas buenas
Modelos causales con LISREL
-La re-especificación debe ser testada en OTRA MUESTRA Enero 2007
a los modelos Tema
de 4
ecuaciones Modelos competitivos
estructurales con Stata – JoseyA.equivalentes
Martínez- UPCT
- M o delo s co m petitivo s y equ iva len tes
-Este asunto es uno de los más “emblemáticos” en SEM, de los que más
posibilidades da al investigador y uno de los más controvertidos
-Es un principio fundamental en la metodología SEM el poder aceptar que

pueden existir explicaciones alternativas al modelo hipotético propuesto
por el investigador y que sean igualmente válidas.
-No obstante, y como bien indica Hayduk, un modelo es interpretable por

sí mismo, aunque este autor reconoce que debe tenerse en cuenta la
consideración de modelos rivales para analizar si otros modelos
interpretables pueden también ajustarse a los datos empíricos. Cuando el
modelo hipotético está mal especificado, aún es más recomendable estudiar
el ajuste de alternativas teóricas
a los modelos Tema
de 4
- Ejemplo del manual de SEM con Stata (ver el diagrama causal en el manual)
-use http://www.stata-press.com/data/r12/sem_sm2

a los modelos Tema
de 4
-El modelo tiene un ajuste infame. Ahora hay que pensar en modelos
alternativos o en reespeficiación. Si aún así, no mejora el ajuste, entonces
nuestro modelo teórico no es bueno.

Sesión 6
Planteamiento y discusión sobre

investigaciones de los alumnos

Curso Stata SEM Jose A Martinez Diciembre 2012 UPCT

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Curso Stata SEM Jose A Martinez Diciembre 2012 UPCT

Caricato da

Copyright:

Formati disponibili

Curso de introducción

práctica a las ecuaciones

Introducción, recordatorio de regresión

¿Qué es una variable aleatoria? (Hayduk, 1987)

Aquí tenemos ya el primer escollo sobre el concepto de aleatoriedad en una

•¿Qué es una variable aleatoria? (Krishnamoorthy, 2006)

¿Qué es una relación entre 2 variables? (Hayduk, 1987)

A relationship exists between 2 variables if the distribution of the cases on

¿Qué es una covarianza? (Hayduk, 1987)

The covariance between X and Y is defined and calculated as the expected

Modelo de regresión múltiple (sencillo para empezar)

Se suele utilizar OLS por su sencillez y robustez

y x1 x2 yest x1est x2est

Source SS df MS Number of obs = 20

y1est Coef. Std. Err. t P>|t| [95% Conf. Interval]

-Estimar un modelo de regresión en desviaciones sobre la media y comparar

-¿ Qué conclusiones sacamos sobre el valor de los coeficientes y de los

- Por tanto, no hay término constante en el modelo (cuidado con la interpretación de

- En SEM el Rcuadrado sólo es interpretable si el modelo se ajusta (lo veremos

Wooldridge (2002). Introducción a la econometría. Un enfoque

- La mayoría de los datos son de naturaleza no experimental, por lo que

- OLS: supuesto clave el de cov(x,u)=0, lo que se conoce como exogeneidad, y

Wooldridge (2002). Introducción a la econometría. Un enfoque

Asumimos también una muestra aleatoria, no colinealidad perfecta (a medida que

Wooldridge (2002). Introducción a la econometría. Un enfoque

- ¿Q u é h a cer cu a n do se in cu m plen su pu esto s?

- Violación de homocedasticidad: Recordemos que homocedasticidad significa que la

Wooldridge (2002). Introducción a la econometría. Un enfoque

¿Q u é h a cer pa ra estu dia r em pírica m en te la m a la especifica ció n ?

- Test RESET, que Stata lo hace fácilmente, en el que se incluyen valores

- Si tenemos varios modelos candidatos, Wooldridge (2002) recomienda el

Wooldridge (2002). Introducción a la econometría. Un enfoque

- E rro r de m edida en la s co va ria bles: El error de medida en las

Wooldridge (2002). Introducción a la econometría. Un enfoque

- E rro r de m edida en la s co va ria bles:

Básicamente, y asumiendo que la covarianción entre el error de medida y la

¿Q u é o cu rre co n la s o bser va cio n es a típica s y la s

- Hay que plantearse si esas observaciones provienen de la misma población

- Otras opciones, son por ejemplo regresión robusta a través de la

Suma de matrices: sólo matrices del mismo tamaño pueden sumarse o

La multiplicación por un escalar no afecta al tamaño de la matriz

La multiplicación de matrices sólo puede hacerse si el número de filas de la

Es una matriz 1/n(XX’) donde X son las desviaciones sobre la media de n

Cuando una fila o columna de una matriz es linealmente dependiente de otra,

El determinante de una matriz es un escalar que es únicamente definido para

Dada una matriz cuadrada A de orden n, definimos el adjunto de un elemento aij

es decir, no es más que el menor complementario correspondiente acompañado de

Dada una matriz cuadrada A de tamaño n se define su determinante como la suma

Propiedad: Una matriz cuadrada A tiene inversa ⇐⇒ |A| distinto de 0.

Además, en este caso, la matriz inversa de A, A−1 se calcula de la manera:

La causalidad debe ser planteada de forma cualitativa

No obstante existen algoritmos para “descubrir” relaciones causales (IC, TETRAD).

Durvasula, S., Sharma, S. y Carter, K. (2012). Correcting

Jose Antonio Martínez García

The key question then is how to design error-free measures? There is no

Primeros pasos con SEM y Stata

Principios del modelado estadístico

Datos = Modelo + Error

Ajuste Proceso de modelado

Evaluación del modelo (Ato y López, 1996)

-Criterio de la parsimonia (Navaja de Occam o principio de la pluralidad

-En SEM los metodólogos discuten acerca de la adecuación al criterio de la

- Ideas importantes sobre causalidad