Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Sesión 1
- Recordatorio
E ( xi ) = ∑ pi xi
i
E (axi ) = aE ( xi ) si a =cte
E (a + xi ) =a + E ( xi )
E (a) = a
=
Var ( x) E ( x 2 ) − E ( x) 2
Var ( x + =
y ) Var ( x) + Var ( y ) + 2Cov( x, y )
Cov( x, y ) =E [ ( x − E ( x))( y − E ( y ) ]
Cov( x, a ) = 0
Cov(ax, y ) = aCov( x, y )
Cov( x, x) = Var ( x)
Cov( x, y= + z ) Cov( x, y ) + Cov( x, z )
Jose Antonio Martínez García
Modelos causales con LISREL Enero 2007
Curso de introducción práctica a los modelos de ecuaciones estructurales con Stata – Jose A. Martínez- UPCT
¿Quiere esto decir que necesito que el muestreo sea aleatorio? Ya veremos
posteriormente que SEM no necesariamente trabaja con muestras aleatorias
¿Qué es una variable aleatoria? (Kaltenbach, 2011)
These are functions mapping an outcome to a number. The advantage of working
with random variables instead of events comes from the fact that random variables
have a probability distribution that describes the probability that the random
variable takes a value smaller or equal to a certain number
Intuitivamente podemos decir que una variables es aleatoria cuando sus valores
dependen del resultado del experimento. Cada vez que el experimento se realiza el
valor de la variable aleatoria puede ser distinto.
Curso de introducción práctica a los modelos de ecuaciones estructurales con Stata – Jose A. Martínez- UPCT
Cov(XY)=E(X-E(X))(Y-E(Y)))
For independent X and Y, the covariance
is zero. The converse, however, is not true
Curso de introducción práctica a los modelos de ecuaciones estructurales con Stata – Jose A. Martínez- UPCT
x1 x2 x1 x2
1 1 1 1
2 4 2 4
3 9 1 2
4 16 2 4
5 25 1 3
6 36 2 4
7 49 1 4
Diferencia entre estos 2 casos en 8 64 2 4
9 81 1 5
cuanto a relación y covarianza 10 100 2 4
11 121 1 6
12 144 2 4
13 169 1 7
14 196 2 4
15 225 1 8
16 256 2 4
17 289 1 9
18 324 2 4
19 361 1 10
20 400 2 4
cov 698,25 cov -0,38
corr 0,97 corr -0,35
Curso de introducción práctica a los modelos de ecuaciones estructurales con Stata – Jose A. Martínez- UPCT
yi f ( xik ) + ui
hay que postular asunciones sobre ui
E (ui ) = 0
Distribución de probabilidad de ui
Cov( x, u ) = 0
α + ∑ γ k xik + ui
yi =
Diferentes métodos de estimación (OLS, ML)
y1 Coef. Std. Err. t P>|t| [95% Conf. Interval] Depende de la varianza del
error, de la variación
x1 .0449102 .0026751 16.79 0.000 .0392662 .0505542 muestral en esa variable y
de las relaciones lineales
x2 .0568862 .6669788 0.09 0.933 -1.350316 1.464088 de las covariables
_cons 3.97006 1.092717 3.63 0.002 1.664629 6.275491 (Wooldridge, 2002). Para
que sea lo más pequeño
posible nos interesa que la
varianza del error sea
pequeña, haya gran
variablidiad en esa
. regress y1est x1est x2est
covariable y poca
colinealidad
Source SS df MS Number of obs = 20
F( 2, 17) = 140.62
Model 17.9631798 2 8.98158988 Prob > F = 0.0000
Residual 1.08582058 17 .063871799 R-squared = 0.9430
Adj R-squared = 0.9363
Total 19.0490003 19 1.00257897 Root MSE = .25273
Ejercicio 1
- sum
- gen y_desv=y-10.5
- gen x1_desv=x1-143.5
- gen x2_desv=x2-1.5
- regress y_desv x1_desv x2_desv
- regress y_desv x1_desv x2_desv, beta
- SEM suele trabajar (no siempre) con variables en desviaciones sobre la media
- SEM trabaja con relaciones lineales (aunque también se pueden emplear modelos
más complejos no lineales, pero pueden dar problemas de estimación).
L en g u a je m a tricia l
L en g u a je m a tricia l
¿Q u é es u n a m a triz de co va ria n za s?
In versió n de m a trices:
Una matriz multiplicada por su inversa resulta en una matrix identidad (ceros en
todos sus elementos salvo unos en la diagonal principal). El problema está en
cómo calcular la inversa de un matriz (diversos métodos aprendidos en el
Instituto…)
SEM es una metodología utilizada para huir desde la causalidad cualitativa (ej. El
barro no causa la lluvia) hacia la causalidad cuantitativa (ej. La lluvia causa que
el cultivo crezca). Todo lo que hace SEM es derivar la última de la primera a
partir de unas asunciones causales, las cuales se refieren a cualquier asunción
que es usada en un estudio que no puede ser derivada de los datos solamente,
incluso cuando el número de muestra crece indefinidamente. Por ejemplo, que el
barro no causa la lluvia, es decir, que las conclusiones son válidas si las
asunciones son validas.
- M o delo s ca u sa les
-Modelos funcionales ecuaciones funcionales deterministas y asignación de aleatoriedad
a las variables no incluidas en el modelo
- Pearl (2000) define las ecuaciones estructurales de la siguiente forma: “Una ecuación
y=βx+u se dice que es estructural si es interpretada como sigue: En un experimento
ideal donde contralamos X a x y cualquier otro conjunto de variables Z (que no contienen
X o Y) a z, el valor de y de Y es dado por βx+u, donde u no es una función de los
conjuntos x y z”.
- La elucidación causal de la ecuación reside en el coeficiente β, el cual es interpretado
por Pearl (2000) como el valor de cambio en la esperanza de y, E(y), cuando x cambia en
una unidad. Pearl habla de la palabra “cambio” y no de la “expectativa condicionada”. Es
decir, si se tuvieran los medios físicos para fijar el valor de x a algún valor constante x1,
y cambiar esa constante de x1 a x2, entonces el cambio observado en E(y) sería β(x2-x1).
Problema: Filosofía de “ceteris paribus” cuando los predictores no son ortogonales.
Jose Antonio Martínez García
Modelos causales con LISREL Enero 2007
Tema
Curso Tema
1de introducción
Fiabilidad 2práctica Tema
en ciencias 3
a los modelos
sociales Tema
de 4
ecuaciones estructurales La
concausalidad
Stata – Joseprobabilística
A. Martínez- UPCT
Sesión 2
Selección
Evaluación
Interpret.
- Proponer un modelo que explique los datos con el menor error posible
Jose Antonio Martínez García
Modelos causales con LISREL
- El modelo es el componente determinista y el error es el estocástico Enero 2007
Tema Tema 2práctica Tema
Curso1de introducción 3
a los modelos Tema
de 4
ecuaciones Filosofía de
estructurales conajuste.
Stata – Modelado estadístico
Jose A. Martínez- UPCT
-¿Qué es SEM?
-Puede operar con variables latentes, lo que permite contar con el error de medida
en la estimación de los coeficientes estructurales
-Variables latentes
Tal y como indican MacCallum y Austin (2000) las variables latentes son
constructos hipotéticos que no pueden ser directamente medidos. Es decir, se
manifiestan a través de una serie de indicadores observables que, como
revela Bollen (2002), son localmente/condicionalmente independientes y
definen el valor esperado de la variable latente, la cual es una función no
determinista de esos indicadores.
Permiten tener en cuenta el error en la medición (cubre algunas limitaciones
de la regresión)
- El modelo de factor
x1 λ11ξ1 + δ1
=
λ11 λ21 λ31
x1 x2 x3
λ41
x4
x2 λ21ξ1 + δ 2
=
x3 λ31ξ1 + δ 3
=
δ1 δ2 δ3 δ4
x4 λ41ξ1 + δ 4
=
X =Λξ + δ
Jose Antonio Martínez García
Modelos causales con LISREL Enero 2007
Tema Tema 2práctica Tema
Curso1de introducción 3
a los modelos Tema
de 4
ecuaciones Planteamiento
estructurales algebraico
con Stata de SEM UPCT
– Jose A. Martínez-
- El modelo de factor
Ejercicio 2
- Cerrar Excel e importar desde Stata con cuidado con las filas (otra opción es
copiar/pegar)
-Estimar SEM
-¿Qué pasa con el término constante? ¿Cuál es el ajuste del modelo? ¿Qué
ocurre con los casos perdidos? ¿Significación parámetros)
Curso de introducción práctica a los modelos de ecuaciones estructurales con Stata – Jose A. Martínez- UPCT
-Ejercicio 3
-Ejercicio para casa: Estimar el mismo modelo con los datos en desviaciones
sobre la media
Sesión 3
Φ21
ε1 ε2
x1 x2 x3 x4 x5 x6 x7 x8 x9
δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8 δ9
-Ejercicio 4
- El modelo causal
γ11
ε1 η1 ζ1
x1 x2 x3 x4 y1
δ1 δ2 δ3 δ4 ε5
- El modelo causal
x1 λ11x ξ1 + δ1
=
x2 λ 21x ξ1 + δ 2
=
Modelo de medida
x3 λ31 ξ1 + δ 3
= x
x4 λ 41x ξ1 + δ 4
=
y1 λ11yη1 + ε1
=
η1 γ 11η1 + δ1
= Modelo “estructural”
X =Λ xξ + δ
Y= Λ yξ + ε
η =Γξ + ζ
Jose Antonio Martínez García
Modelos causales con LISREL Enero 2007
Tema Tema 2práctica Tema
Curso1de introducción 3
a los modelos Tema
de 4
ecuaciones Planteamiento
estructurales algebraico
con Stata de SEM UPCT
– Jose A. Martínez-
γ
CAL LEA
0,53
1 1
x1 y1
0 0
-Ejercicio 5
Structural
X2 <-
X1 .642588 .0719472 8.93 0.000 .501574 .7836019
Measurement
p19 <-
X1 1 (constrained)
_cons 2.80198 .0653164 42.90 0.000 2.673962 2.929998
p28 <-
X2 1 (constrained)
_cons 3.143564 .0780918 40.25 0.000 2.990507 3.296622
Variance
e.p19 .0086178 (constrained)
e.p28 .0123186 (constrained)
e.X2 .8672588 .0878752 .7110506 1.057784
X1 .8531604 .0857501 .7006118 1.038924
γ1 0,27
CAL LEA
1 γ2 1
0,4
9
x1 SAT y1
1
0 0
x2
-Ejercicio 6
-3. Estimar
( 1) [p28]Y1 = 1
( 2) [p19]X1 = 1
( 3) [p23]X2 = 1
( 4) [var(e.p19)]_cons = .1723557
( 5) [var(e.p23)]_cons = .1612832
( 6) [var(e.p28)]_cons = .2463729
OIM
Coef. Std. Err. z P>|z| [95% Conf. Interval]
Structural
Y1 <-
X1 .2795202 .1271798 2.20 0.028 .0302523 .5287882
X2 .7769259 .1326244 5.86 0.000 .5169868 1.036865
Measurement
p19 <-
X1 1 (constrained)
_cons 2.80198 .0653164 42.90 0.000 2.673962 2.929998
p23 <-
X2 1 (constrained)
_cons 3.410891 .0631835 53.98 0.000 3.287054 3.534729
p28 <-
Y1 1 (constrained)
_cons 3.143564 .0780919 40.25 0.000 2.990507 3.296622
Variance
e.p19 .1723557 (constrained)
e.p23 .1612832 (constrained)
e.p28 .2463729 (constrained)
e.Y1 .3434631 .0697178 .2307273 .5112826
X1 .6894226 .0857501 .5402731 .8797467
X2 .6451328 .0802414 .505565 .8232302
Covariance
Sesión 4
-Cuanto más pequeños sean los residuos, mayor será el ajuste, porque ambas
matrices concuerdan en mayor medida.
-Sin embargo, hay que tener mucho cuidado con estas directrices generales,
porque un solo residuo muy grande puede provocar el mismo efecto sobre el
ajuste que muchos residuos pequeños.
- Por tanto, no se utilizan los datos brutos para obtener los parámetros
estimados y el ajuste del modelo, sino que se parte de la matriz de covarianzas,
y se asume que esa matriz sigue una distribución Wishart, es decir, que ha sido
generada a partir de una normal multivariante con media cero y matriz de
covarianzas Σ. La normal multivariante con media cero nos ayuda a entender el
por qué se toman los valores de los datos brutos en desviaciones sobre la media
(como hacen programas como LISREL)
Jose Antonio Martínez García
Modelos causales con LISREL Enero 2007
Tema Tema 2práctica Tema
Curso1de introducción 3
a los modelos Tema
de 4
ecuaciones Planteamiento
estructurales algebraico
con Stata de SEM UPCT
– Jose A. Martínez-
-Que es lo mismo que minimizar la función que está dentro de los corchetes (llamada
función de discrepancia). Esta expresión está basada en datos en desviaciones sobre la
media. Para considerar las medias (y así estimar los intercepts) hay que añadir un
vector de medias (es lo que hace Stata por defecto)
-De este modo , tenemos un test estadístico que cuantifique la bondad de ajuste
del modelo
-Por tanto, hay que reflexionar sobre el nivel de significación correcto para
aceptar la hipótesis nula, ya que ésta, tiene un sentido diferente a las de las
habituales sobre test de parámetros. Por ejemplo, para rechazar la hipótesis nula de
igualdad de diferencia de medias, se necesita un probabilidad <0.05, lo que indica
que en menos de 1 de cada 20 muestras habrá un falso positivo. Es decir, una
evidencia fuerte para rechazar una teoría, ya que la probabilidad de los datos
dado Ho es muy pequeña.
Consejos sobre estimación (en otros programas más allá de Stata, como LISREL)
Consejos sobre estimación (en otros programas más allá de Stata, como LISREL)
-Si los datos son ordinales, o mezcla de ordinales y continuos, usar DWLS
(muestras moderadas) o WLS (muestras muy grandes) y matriz PM
-ML soporta variables exógenas binarias. Usar matriz CM.
-Cuando se usa CM hay que reescalar varianzas si usamos datos con escalas de
medida muy dispares
Ajuste exacto
-Ho: modelo se ajusta perfectamente en la población
-Uso del p-valor 0.05 como criterio dicotómico, incluso pretensión de elevarlo a
0.80
-Las asunciones deben ser correctas
-Si existe fuentes de sesgo hay que incluirlas en el modelo
-No sirven la filosofía de Cohen, Meehl y otros sobre la existencia del “crud
factor”, ya que el test del modelo es diferente al test de parámetros
-No existe ningún test estadístico más en SEM. Es incorrecto que modelos que no
se ajustan sigan una chi-cuadrado no central
Ajuste exacto
-El tamaño de muestra es el criterio de potencia: a mayor N, mayor probabilidad
de detectar una mala especificación
-La ciencia avanza igualmente con modelos que no se ajustan. Se aboga por la
honestidad
-Defensores (unos pocos): Leslie Hayduk, Dale Glasser, Paul Barrett (con matices),
Manuel Ato
Opinión personal
Opinión personal
Importante
-1. Grados de libertad > 0. “Condición de orden”.Esto significa que hay más
elementos no redundantes en la matriz de covarianzas de entrada que
parámetros a estimar. Modelos con gl=0 son científicamente poco útiles.
Recordar que los mejores modelos son los que tienen mayor grado de
falsabilidad (mayores restricciones causales fijadas a cero)
Sesión 5
Lealtad 6
Calidad 1
1 p28 p30
0 0
p19 p20
0 0 7 8
Satisfacción 3
1 2
1
p23 p24
0 0
4 5
Jose Antonio Martínez García
Modelos causales con LISREL Enero 2007
Tema Tema 2práctica Tema
Curso1de introducción 3
a los modelos Tema
de 4
ecuaciones Identificación
estructurales del modelo
con Stata – Jose A. Martínez- UPCT
sem (Calidad@1 -> p19) (Calidad -> p20) (Calidad -> Satisfacción)
(Calidad -> Lealtad) (p19 <- _cons@0) (p20 <- _cons@0)
(Satisfacción@1 -> p23) (Satisfacción -> p24) (p23 <- _cons@0)
(p24 <- _cons@0) (Lealtad@1 -> p28) (Lealtad -> p30) (p28 <-
_cons@0) (p30 <- _cons@0), latent(Calidad Satisfacción Lealtad )
reliab(p19 .9 p23 .9 p28 .9 )
Re-especifia ció n
-Los índices de modificación deben ser usados con cautela. Realmente sólo
son útiles en casos en que existe una clara mala especificación en uno o dos
coeficientes, y el programa es capaz de detectarla sin ninguna perturbación.
Es una información parecida a la que dan los residuos.
-Este asunto es uno de los más “emblemáticos” en SEM, de los que más
posibilidades da al investigador y uno de los más controvertidos
- Ejemplo del manual de SEM con Stata (ver el diagrama causal en el manual)
-use http://www.stata-press.com/data/r12/sem_sm2
-El modelo tiene un ajuste infame. Ahora hay que pensar en modelos
alternativos o en reespeficiación. Si aún así, no mejora el ajuste, entonces
nuestro modelo teórico no es bueno.
Sesión 6