Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Otoño 2008
Instructor: Federico Todeschini
Email: todeschini.federico@upf.edu
Oficina: Jaume I, 158
2&3-1
La Econometría es el análisis estadístico de los datos
económicos (y relacionados)
Libro recomendado:
Introduction to Econometrics 2nd edition, by J.H. Stock and
M.W. Watson, Addison-Wesley, 2007. Sirven la edición
americana y la internacional ya que es la 1ª ed. (algunas
copias en la librería).
2&3-
Las prácticas se tienen que hacer en grupos. Pueden ser de
dos o de tres. Se entregará una sóla práctica por grupo y
la nota será la misma para todos sus miembros. Por favor,
poned los nombres de todos los miembros del grupo. Añadid
a la práctica también vuestros archivos “log” del STATA.
2&3-5
Evaluación del curso:
Ejercicios: 20%; Examen Parcial: 30%; Examen Final:50%.
2&3-7
En este curso:
•
Aprenderás métodos para estimar efectos causales usando
datos experimentales y observacionales (los métodos son los
mismos);
•
Aprenderás algunas herramientas que te serán útiles para otros
propósitos, como hacer predicciones usando series temporales;
•
Te centrarás en las aplicaciones – la teoría se usará sólo
cuando haga falta entender el “por qué” de los métodos;
•
Aprenderás cómo producir (haciendo tu el análisis) y consumir
(evaluando el trabajo de otros) aplicaciones econométricas; y
•
Practicarás “produciendo” en tus prácticas
2&3-
Repaso de Probabilidad y Estadística
(SW Capítulos 2, 3)
Problema empírico: Tamaño de la clase y resultados académicos
•
Pregunta política: ¿Qué efecto tiene reducir el tamaño de las
clases en un alumno por clase? ¿y en 8 alumnos/clase?
•
¿Cómo medimos el output de la educación (“variable
dependiente”)?
Satisfacción de los padres
Desarrollo personal del estudiante
Futuro bienestar adulto y/o ingreos
Resultados de tests estandarizados
2&3-9
¿Qué nos dicen los datos sobre la relación tamaño de la clase/
resultados del test?
2&3-11
¿Tienen los distritos con clases menores mejores resultados?
2&3-
¿ Cómo podemos obtener alguna evidencia numérica sobre si los
distritos con STR bajo obtienen mejores notas en los tests?
2&3-13
Análisis inicial de los datos: Comparar distritos con tamaños de
clase “bajo” (STR<20) con “alto” (STR≥20)
Donde y
(te acuerdas?)
2&3-
Calcular el t-estadístico para la diferencia de las medias:
Tamaño sY n
bajo 657.4 19.4 238
alto 650.0 17.9 182
2&3-
Todo esto debería ser familiar. Pero:
2&3-19
1. Teoría de la probabilidad para la inferencia estadística
2. Estimación
3. Contrastes de hipótesis
4. Intervalos de confianza
Población
•
El grupo o colección de entidades de interés
•
Aquí, “todos los posibles” distritos escolares
•
“Todos los posibles” significa todas los posibles
circunstancias que llevan a valores específicos de STR, notas
del test
•
Pensamos en las poblaciones como infinitas; nuestra tarea es
haces inferencia usando una muestra de una gran población
2&3-
Variable aleatoria Y
•
Resumen numérico de un resultado aleatorio
•
Aquí, el valor numérico de las notas medias de los
distritos (o STR del distrito), una vez hemos escogido un
año/distrito del que extraer una muestra.
Distribución poblacional de Y
•
Las probabilidades de diferentes valores de Y que ocurren
en la población, por ej. Pr[Y = 650] cuando Y discreta)
•
o: Las probabilidades de conjuntos de esos valores, por ej.
Pr[Y 650] (cuando Y continua).
2&3-21
“Momentos” de la distribución poblacional
media = valor esperado
= E(Y)
= µY
= valor esperado de Y a largo plazo cuando se
obtienen realizaciones repetidas de Y
Teorema de Bayes
•
Si A y B son dos eventos tales que P(A)>0 y P(B)>0,
entonces:
2&3-23
Este es posiblemente uno de los teoremas más importantes
para el análisis de datos (de todas maneras, en este curso lo
utilizaremos poco, no obstante, es bueno que siempre lo
recuerden).
2&3-25
Distribuciones condicionales
•
La distribución de Y, dados el/los valor/es de otra variable
aleatoria, X
•
Ej: la distribución de las notas del test, dado que STR <
20
2&3-27
Inferencia sobre medias, medias condicionales y
diferencia entre medias condicionales
Nos gustaría saber Δ (dif. Entre nota test; dif. Entre salaries
por género; efecto tratamiento exp.), pero no lo sabemos.
Así que tenemos que recopilar datos que nos permitan hacer
inferencias estadísticas sobre Δ.
•
Datos experimentales
•
Datos observacionales
2&3-
Muestreo aleatorio simple
•
Escoge un individuo (distrito, entidad) de la población al
azar
Aleatoriedad y datos
•
Antes de seleccionar la muestra, el valor de Y es aleatorio
porque el individuo se selecciona al azar
•
Una vez se selecciona al individuo y se observa el valor
de Y, momento en que Y deja de ser un número aleatorio
•
El conjunto de datos es (Y1, Y2,…, Yn), donde Yi = valor de
Y para el individuo i (distrito, entidad) seleccionado
2&3-29
Implicaciones del muestreo aleatorio simple
Dado que los individuos #1 y #2 ha sido seleccionados al azar, el
valor de Y1 no contiene información sobre Y2. Entonces:
•
Y1, Y2 se distribuyen independientemente
•
Y1 y Y2 provienen de la misma distribución, esto es, Y1, Y2
están distribuidos idénticamente.
•
Esto es, una consecuencia del muestreo aleatorio es que Y1 y
Y2 son independientes e idénticamente distribuidos (i.i.d.).
•
En general, bajo muestreo aleatorio simple, {Yi}, i = 1,…, n,
son i.i.d
2&3-
1. Teoría de la probabilidad para la inferencia estadística
2. Estimación
3. Contrastes
4. Intervalos de confianza
mediana(Y ,…, Y )
1 n
2&3-31
Para contestar estas preguntas necesitamos caracterizar la
distribución muestral de
•
Los individuos de la muestra se seleccionan al azar.
•
Entonces, los valores de (Y1,…, Yn) son aleatorios
•
Entonces, funciones de (Y1,…, Yn), como , son aleatorias: si
extrajéramos otra muestra tendrían distinto valor
•
La distribución de sobre distintas muestras de tamaño n se
llama la distribución muestral de .
•
La media y la varianza de son la media y varianza de su
distribución muestral, E( ) y var( ).
•
Para calcular var( ), necesitamos conocer la función la
covarianza
2&3-
La covarianza entre las v.a. X y Z es,
cov(X,Z) = E[(X – µX)(Z – µZ)] = σXZ
•
La covarianza mide el grado de asociación lineal entre X y
Z ; sus unidades son las unidades X ! unidades de Z
•
cov(X,Z) > (<) 0: X y Z relación entre X y Z positiva
(negativa)
•
Si X y Z están distribuidas independientemente, entonces
cov(X,Z) = 0 (pero lo opuesto no es necesariamente
cierto!!)
•
La covarianza de una v.a. con ella misma es su varianza:
cov(X,X) = E[(X – µX)(X – µX)] = E[(X – µX)2] =
2&3-33
La covarianza entre Nota Test y STR es negativa:
2&3-
El coeficiente de correlación se define en términos de la
covarianza
corr(X,Z) = = rXZ
•
•
corr(X,Z) = 1 significa asociación lineal positiva perfecta
•
corr(X,Z) = -1 significa asociación lineal negativa perfecta
•
corr(X,Z) = 0 significa no hay asociación lineal.
•
If E(X|Z) = const, entonces corr(X,Z) = 0 (pero lo opuesto
no es necesariamente cierto)
2&3-35
Los coef. de correlación miden asociación linear
2&3-
Los coef. de correlación miden asociación linear
2&3-37
La media y varianza de la
distribución muestral de
media: E( ) = E( )= = = µY
=E
=E
2&3-
entonces var( ) =
= =
Resumen: E( ) = µY y var( ) =
2&3-39
Implicaciones:
• es un estimador no sesgado de µY (esto es, E( ) = µY)
•
var( ) es inversamente proporcional a n
•
la dispersión de la distribución muestral es proporcional a
1/
•
en este sentido, la incertidumbre muestral que surge de usar
para hacer inferencia sobre µY es proporcional a 1/
2&3-
¿Qué hay del total de la distribución de , no sólo la media y
la varianza?
En general, la distribución muestral exacta de es muy
complicada y depende de la distribución poblacional de Y.
2&3-41
2&3-
Para tamaños de muestra pequeños, la distribución de es
complicada.
•
Esto es, “estandarizada” = = se
distribuye aproximadamente como N(0,1)
•
La aproximación mejora a medida que n crece 2&3-45
Ejemplo: Y tiene distribución Bernoulli, p = 0.78:
2&3-
Mismo ejemplo: distribución de :
2&3-47
2&3-
Resumen: para (Y1,…,Yn) i.i.d. con 0 < < infinito,
•
La distribución muestral exacta (muestra finita) de tiene
media µY (“ es un estimador no sesgado de µY”) y
varianza /n
•
A parte de su media y varianza, la distribución exacta de
es complicada y depende de la distribución de Y
• µY (Ley de los grandes números)
•
se distribuye aproximadamente N(0,1) (T.L.C.)
2&3-49
2&3-
2&3-51
Entonces, ¿por qué usar para estimar µY?
• Falta de sesgo: E( ) = µY
• consistencia: µY
• es el estimador de “mínimos cuadrados” de µY; resuelve,
2&3-
Cálculo del p-valor basado en :
p-valor = ,
donde es el valor de observado (no aleatorio)
2&3-55
p-valor = ,
p-valor = ,
=
probabilidad bajo las colas izquierda +
derecha de N(0,1)
2&3-
Denotemos la desv. std. de la distribución de como :
2&3-57
En la práctica, σY es desconocido y tenemos que estimarlo
Estimador de la varianza de Y:
=
Hechos:
Si (Y1,…,Yn) son i.i.d. y E(Y4) < , entonces
¿Por qué usamos la Ley de los Grandes Números? Porque
es una media muestral; mirar Apéndice 3.3
Nota técnica: asumimos E(Y4) < porque aquí la media no
es de Yi, sino de su cuadrado; mirar Ap. 3.3
2&3-
Calcular el p-valor con estimado:
p-valor = ,
( gran n)
=
probabilidad bajo las colas de la normal, donde
2&3-
La distribución t de Student
Si Y se distribuye N(µY, ), entonces el estadístico t tiene una
distribución t de Student (tabulada en los apéndices de todos
los libros de estadística)
Algunos comentarios:
• Para n > 30, la distribución t y N(0,1) son muy similares
• La suposición que Y se distribuye N(µY, ) es raramente plausible
en la práctica (ingreso? Número de hijos?)
• La distribución t es un vestigio de los tiempos en los que las
muestras eran muy pequeña
• En esta clase no usaremos la distribución t – confiaremos sólo en la
aproximación para grandes muestras proporcionada por el TLC
2&3-61
1. Teoría para la inferencia estadística
2. Estimación
3. Contrastes de hipótesis
4. Intervalos de confianza
2&3-63
Este intervalo de confianza se basa en el resultado para
grandes n que tiene una distribución aproximadamente
normal y .
2&3-
2&3-65
Bien, hemos visto como contrastar hipótesis y construir
intervalos de confianza para la media poblacional, µY. ¿Pero
cómo contrastamos hipótesis sobre dos medias
poblacionales?
donde y
aproximadamente N(µY, ).
2&3-67
Dado que las dos medias son independientes, – se
distribuye N[(µs - µl,),(σs2/ns+σl2/nl)].
2&3-
Esto se calcula fácilmente con STATA:
generate d = (str>=20)
ttest testscr,by(d) unequal
Two-sample t test with unequal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
0 | 238 657.3513 1.254794 19.35801 654.8793 659.8232
1 | 182 649.9788 1.323379 17.85336 647.3676 652.5901
---------+--------------------------------------------------------------------
combined | 420 654.1565 .9297082 19.05335 652.3291 655.984
---------+--------------------------------------------------------------------
diff | 7.37241 1.823689 3.787296 10.95752
------------------------------------------------------------------------------
diff = mean(0) - mean(1) t = 4.0426
Ho: diff = 0 Satterthwaite's degrees of freedom = 403.607
2&3-69
2&3-
Solución:
a) Dado que es un evento del tipo Bernoulli (eliminando la
gente que vota en blanco), sea p la probabilidad de votar a
Bush en Septiembre y (1-p) la de votar a Kerry. Entonces
p=405/755=0,536 y (1-p)=0,464. La varianza es var(p)=p*
(1-p)/n=0,2487/755=0.000329 y el error estándar por lo
tanto es 0,01813836. Por lo tanto, el intervalo de confianza
al 95% será:
2&3-71
c) Ahora debemos plantearnos un test de medias, para ver si las
preferencias de los votantes han cambiado o no. Para ello
construimos planteamos el test de hipótesis de que las
preferencias de los votantes por Bush no cambiaron entre
septiembre y octubre
2&3-73
Pregunta política original:
Cuál es el efecto de reducir STR en un estudiante/clase sobre
las notas de los test?
Hemos contestado la pregunta?
• Hemos examinado Δ = la diferencia entre las medias, pocos
•
Más bien, el interés político radica en
•
Pero esto es la pendiente de una recta que relaciona la nota
del test con STR
•
Así que debemos estimar esta pendiente de algún modo…
2&3-