Sei sulla pagina 1di 15

9.

Preguntas y problemas

1. Un investigador plantea que estudiar la licenciatura de ciencia poltica aumenta el


inters por la poltica en comparacin con estudiar cualquier otra licenciatura. Cuando
observa los datos de los individuos licenciados, en efecto descubre que a los estudiantes
de ciencia poltica en Espaa les interesa ms la poltica que a los dems universitarios.
Discute el argumento y sus resultados desde un punto de vista metodolgico.

En este estudio existe un problema de endogeneidad: la variable independiente,


la licenciatura estudiada, es la causa de la variable dependiente, el inters por la
poltica, una vez que se ha cursado la carrera. Pero la variable dependiente es tambin
la causa de la independiente en un momento anterior, puesto que cuando un individuo
decidi qu carrera estudiar, con seguridad los que tenan un mayor inters por la
poltica fueron los que acabaron cursando ciencia poltica. La inferencia causal que
hace el investigador no es vlida y, adems, ya que se carece de datos sobre el inters
de la poltica de los individuos antes de comenzar sus estudios universitarios, no es
posible determinar la direccin e intensidad del error.

Para resolver este problema, el investigador debera analizar las diferencias en


el inters por la poltica de los individuos slo durante los aos que se cursan los
estudios universitarios. La variable dependiente no debera ser el nivel de inters por la
poltica al acabar la carrera, sino su diferencia desde que el momento en que se inicia y
en el que se termina. En otras palabras, el inters por la poltica antes de comenzar la
carrera debera convertirse en una variable independiente ms.

2. Un investigador est interesado en mostrar cmo influyen los aos de estudio en la


remuneracin mensual de los trabajadores. Para realizar su anlisis emprico se queda
con los trabajadores que superan el percentil 50 en su salario. Explica las consecuencias
de esta decisin sobre la inferencia causal. Qu sucedera de nuevo en trminos de la
inferencia causal si escogiera a los trabajadores que se encuentran por debajo del
percentil 50 en los aos de estudio? Por qu?

En el primer caso, se estn seleccionando las observaciones, en este caso los


trabajadores, en funcin de la variable dependiente, el salario. La consecuencia es la
existencia de un sesgo de seleccin, debido a que se est predeterminando el resultado.
Al restringir la variabilidad de los salarios, ya no es posible encontrar personas que
ganen poco dinero: sea cual sea el nivel de estudios, todos superan el percentil 50 en
su salario La inferencia causal est sesgada. En el segundo caso, la seleccin de las
observaciones se realiza en funcin de la variable independiente, los aos de estudio.
No se comete, por tanto, ningn error, puesto que el investigador no predetermina los
valores de la variable dependiente. Es posible que algunos trabajadores con una
elevada cualificacin ganen mucho dinero y otros poco. La nica consecuencia de la
seleccin de observaciones que se lleva a cabo es que las conclusiones a las que se
llegan slo son vlidas para los trabajadores que estn por encima del percentil 50 en
los aos de estudio, pero no para todos.

3. Supongamos que en el ao 2006 los accidentes de trfico en Espaa alcanzan su nivel


ms bajo desde que se tienen datos al respecto, 1980. Adems, en el ao 2006, por un
lado, se ha empleado por primera vez carn por puntos, y, por otro, se aplican tambin
por primera vez penas de crcel a todos los individuos que circulan por encima de la
velocidad permitida. El Director de la Direccin General de Trfico concluye en su
informe anual que el carn por puntos ha resultado un completo xito, puesto que ha
permitido que los accidentes de trfico en Espaa hayan alcanzado su nivel ms bajo
desde que se tienen datos. Discute la afirmacin del Director de la DGT.

Aunque supongamos que la Espaa de 1980 sea igual a la de 2006 en cualquier


variable independiente interviniente, adems de las dos que nos interesan, la inferencia
que realiza el Director de la DGT no se puede hacer. No existe ningn ao en el que se
haya aplicado el carn por puntos y no las penas de crcel, y a la inversa. Es decir, no
es posible separar el efecto de cada una de estas variables independientes sobre la
dependiente, el nmero de accidentes de trfico. Tenemos un problema de
multicolinealidad perfecta y, por tanto, no se puede hacer una inferencia causal. Para
resolver este problema deberamos reducir la correlacin entre las dos variables
independientes. Una posibilidad, improbable, es conseguir que el gobierno espaol nos
eche una mano y decida suspender durante algunos aos la aplicacin de alguna de las
dos medidas. La segunda posibilidad, la que deberamos seguir, es buscar datos de
otros pases en los que slo se emplee una de las dos medidas. Pero hay que tener en
cuenta que seguramente haya alguna diferencia estos pases y Espaa en lo que se
refiere a otras variables independientes, como el nmero de coches o la velocidad
mxima permitida, por ejemplo. Ser necesario controlarlas para poder hacer una
inferencia causal vlida.

4. Dada la extraordinaria importancia que las elecciones tienen en las democracias


contemporneas, el comportamiento electoral slo puede ser una variable dependiente
en las investigaciones. Discute esta afirmacin.

Se trata de una afirmacin falsa. No hay nada en una variable que la haga ser
dependiente o independiente por definicin. Todo depende cul sea la pregunta de
investigacin

que nos planteemos. Por ejemplo, nos puede interesar estudiar las

razones de que alguna gente vote o no: el comportamiento electoral es aqu la variable
dependiente. Pero tambin nos podra interesar estudiar cmo influye el nmero de
votantes en la estabilidad de las democracias. El comportamiento electoral es ahora la
variable independiente.

5. Un investigador est interesado en mostrar cmo afecta el gasto pblico al


crecimiento econmico. Para realizar su anlisis emprico se queda con los pases cuyo
gasto pblico supera el percentil 60. Explica las consecuencias de esta decisin sobre la
inferencia causal. Qu sucedera de nuevo en trminos de la inferencia causal si
escogiera pases cuyo crecimiento econmico estuviera por encima del 3 por ciento
anual (en trminos de PIB)? Por qu?

En el primer caso, se estn seleccionando las observaciones, en este caso los


pases, en funcin de la variable independiente, el gasto pblico. No se comete, por
tanto, ningn error, puesto que el investigador no predetermina los valores de la
variable dependiente, el crecimiento econmico. Es posible que algunos pases con un
elevado gasto pblico crezcan mucho y otro poco, nada o en negativo. La nica
consecuencia de la seleccin de observaciones que se lleva a cabo es que las

conclusiones a las que se llega slo son vlidas para los pases cuyo gasto pblico est
por encima del percentil 50. En el segundo caso, la seleccin de las observaciones se
realiza en funcin de la variable dependiente, el crecimiento econmico. La
consecuencia es la existencia de un sesgo de seleccin, debido a que se est
predeterminando el resultado. Al restringir la variabilidad del crecimiento econmico,
ya no es posible encontrar pases que crezcan por debajo del 3 por ciento: sea cual sea
el nivel de gasto pblico, todos los pases superan el 3 por ciento de crecimiento. La
inferencia causal est sesgada.

6. Un investigador plantea que estar desempleado depende exclusivamente de la


acumulacin de capital humano de cada individuo, en particular, los aos de estudio que
ha realizado. Otro estudioso del tema le replica que tambin importa el nmero de
zanahorias que ingiere un individuo. Discute cules pueden ser las posibles
consecuencias de que no aparezca esta segunda variable en el modelo de explicacin.

Supongamos que el nmero de zanahorias que ingiere un individuo fuera una


variable independiente relevante. Su omisin supondra un sesgo en la inferencia de la
influencia del capital humano sobre estar desempleado si existiera alguna correlacin
entre las dos variables independientes. As mismo, la direccin del sesgo dependera
del signo de esta correlacin. No obstante, no parece que haya correlacin alguna
entre las dos variables, de modo que excluirla no producira sesgo. Pero no hay ningn
mecanismo causal que nos haga esperar que el nmero de zanahorias que ingiere un
individuo pueda influir en su situacin laboral. Esta variable independiente resulta
irrelevante y, por lo tanto, debemos excluirla de nuestro modelo de explicacin para no
incurrir en ineficiencia.

7. Puesto que la omisin de variables relevantes suele llevar al sesgo, un investigador


debe tener en cuenta el mayor nmero posible de variables en su modelo de explicacin
de un fenmeno. Discute esta afirmacin.

Efectivamente, cuanto mayor sea el nmero de variables independientes que se


tiene en cuenta, menos probable es que se incurra en un sesgo de especificacin. Pero
cuando se incluyen en el modelo de explicacin variables irrelevantes, se cae en la
ineficiencia. En definitiva, slo tenemos que considerar las variables que importan,
aunque es menos grave la ineficiencia que el sesgo. Por tanto, en caso de duda acerca
de incluir o no una variable, es mejor hacerlo.

8. Cmo se puede asegurar que una correlacin entre dos variables sea causalidad y no
algo espurio?

Por un lado, debe demostrarse que la relacin entre las dos variables se
mantiene cuando se introducen variables de control. Si la relacin entre ellas
desaparece cuando se aade una tercera variable, esto significa que era espuria. Por
otro, debe sealarse algn mecanismo causal que muestre cmo la variable
independiente influye en la dependiente. Si no somos capaces de hacerlo, nos queda la
duda de que esta relacin sea espuria.

9. Supongamos que nos interesa estimar la importancia del nivel de estudios en el


salario de los espaoles y que utilizamos una encuesta en la que la seleccin de los
individuos es aleatoria. Un primer investigador se queda slo con aquellos individuos
que de acuerdo con la encuesta tienen estudios de bachillerato o universitarios. Un
segundo investigador se queda slo con aquellos individuos que de acuerdo con la
encuesta tienen estudios primarios, de bachillerato o universitarios. Explica las
diferencias en las inferencias que se pueden hacer en cada caso, si crees que existe
alguna.

Los dos investigadores estn seleccionando las observaciones, individuos, en


trminos de la variable independiente, el nivel de estudios. No se comete, por tanto,
ningn error, puesto que ninguno de los dos predetermina los valores de la variable
dependiente, el salario. La nica consecuencia de la seleccin de observaciones que se
lleva a cabo es que las conclusiones a las que llega el primer investigador slo son
vlidas para los individuos que tienen estudios de bachillerato o universitarios,
mientras que las del segundo son adems vlidas para los que cuentan con estudios
primarios. Por tanto, el segundo investigador puede extender sus conclusiones a ms
individuos que el primero.

10. Para que haya una relacin causal entre dos variables es necesario que exista alguna
correlacin entre ellas. Verdadero o falso? Por qu?

Verdadero. Del mismo modo que la ausencia de correlacin entre dos variables
nos lleva a concluir que no es posible que haya una relacin causal entre ellas, slo
cuando descubrimos alguna correlacin es posible que tengamos causalidad. Pero

correlacin no es causalidad. Para que sea as es necesario que demostremos que no se


trata de una relacin espuria a travs de la inclusin de variables de control y de la
provisin de un mecanismo causal que plantee de qu manera tiene lugar el supuesto
efecto.

11. Supongamos que queremos explicar una variable dependiente determinada. Un


investigador plantea un modelo de explicacin con tres variables independientes. Un
segundo investigador plantea un modelo de explicacin con siete variables
independientes. Cul de las dos es mejor? Por qu?

Depende que cul sea el modelo verdadero o correcto. Si en realidad hacen


falta tres variables independientes para explicar la dependiente, el modelo propuesto
por el primer investigador es el correcto. El del segundo investigador tendra un
problema de eficiencia, puesto que al manejar cuatro variables innecesarias, necesitar
ms observaciones para llegar al mismo resultado que el primer investigador. En otras
palabras, en este segundo caso la explicacin es mucho menos parsimoniosa. Si, por el
contrario, en realidad hace falta siete variables independientes para explicar la
dependiente, el modelo propuesto por el segundo investigador es el correcto. El del
primero tiene varios sesgos por omisin de variables relevantes, de modo que sus
inferencias sobre las variables independientes que tiene en cuenta sern incorrectas.

12. Un investigador est interesado en mostrar cmo influye comer salchichas en el


peso. Para realizar su anlisis emprico se queda con los individuos que superan los 80
kilogramos de peso. Explica las consecuencias de esta decisin sobre la inferencia

causal. Qu sucedera de nuevo en trminos de la inferencia causal si escogiera a los


individuos que comen ms de 148 salchichas al ao? Por qu?

En el primer caso, se estn seleccionando las observaciones, en este caso


individuos, en funcin de la variable dependiente, el peso. La consecuencia es la
existencia de un sesgo de seleccin, debido a que se est predeterminando el resultado.
Al restringir la variabilidad del peso, ya no es posible encontrar personas que tengan
un peso inferior a los 80 kilos: sea cual sea el nmero de salchichas ingeridas, todos
superan los 80 kilos. La inferencia causal est sesgada. En el segundo caso, la
seleccin de las observaciones se realiza en funcin de la variable independiente, las
salchichas ingeridas. No se comete, por tanto, ningn error, puesto que el investigador
no predetermina los valores de la variable dependiente. Es posible que entre los
individuos que coman ms de 148 salchichas haya personas gordas y otras delgadas.
La nica consecuencia de la seleccin de observaciones que se lleva a cabo es que las
conclusiones a las que se llega slo son vlidas para los individuos que comen ms de
148 salchichas, pero no para todos.

13. Un investigador plantea que estudiar un carrera universitaria aumenta el coeficiente


de inteligencia de los individuos. Cuando observa los datos, descubre que los individuos
con estudios universitarios son ms inteligentes que los que no los tienen. Discute el
argumento y sus resultados desde un punto de vista metodolgico, no sustantivo.

En este estudio existe un problema de endogeneidad: la variable independiente,


estudiar una carrera, es la causa de la variable dependiente, el grado de inteligencia,
una vez que se ha cursado la carrera. Pero la variable dependiente es tambin la causa

de la independiente en un momento anterior, puesto que los individuos que estudian


una carrera, seguramente tenan en trminos medios una mayor inteligencia que los
que no la estudian. La inferencia causal que hace el investigador no es vlida y,
adems, puesto que se carece de datos sobre la inteligencia de los individuos antes de
comenzar sus estudios universitarios, no es posible determinar la direccin e intensidad
del error.

Para resolver este problema, el investigador debera analizar las diferencias en


la inteligencia de los individuos slo durante los aos en que se cursan los estudios
universitarios. La variable dependiente no debera ser el coeficiente de inteligencia al
acabar la carrera, sino su diferencia entre el momento en que se inicia y en el que se
termina.

14. Para determinar si el colesterol depende del ejercicio fsico o simplemente de la


gentica, un investigador realiza el siguiente experimento: una vez seleccionados 70
pares de hermanos gemelos, uno de ellos es sometido a un intenso entrenamiento
deportivo diario durante tres meses, mientras que el otro realiza una vida
completamente sedentaria. Discute la importancia de que el experimento tenga como
sujetos de estudio a hermanos gemelos.

Puesto que los hermanos gemelos son genticamente iguales, todas las variables
que pueden influir en el colesterol estn perfectamente controladas son iguales o
constantes entre ellos excepto una: la variable independiente clave, en este caso el
ejercicio. Cualquier diferencia en la variable dependiente, el colesterol, se puede

atribuir al entrenamiento. En fin, la seleccin de hermanos gemelos garantiza el


supuesto de la homogeneidad de las unidades o causal.

15. Un investigador est interesado en mostrar cmo influyen los aos de estudio en el
nmero de libros que lee un individuo. Para realizar su anlisis emprico se queda con
los individuos que han ledo ms de 25 libros al ao. Explica las consecuencias de esta
decisin sobre la inferencia causal.Qu sucedera de nuevo en trminos de la inferencia
causal si escogiera a los individuos que tienen menos de 5 aos de estudios? Por qu?

En el primer caso, se estn seleccionando las observaciones, en este caso


individuos, en funcin de la variable dependiente, el nmero de libros ledos. La
consecuencia es la existencia de un sesgo de seleccin, debido a que se est
predeterminando el resultado. Al restringir la variabilidad del nmero de libros ledos,
ya no es posible encontrar personas que hayan ledo menos de 25 libros al ao: sea
cual sea el nmero de aos de estudio que se acumulen, todas las personas superan los
25 libros. La inferencia causal est sesgada. En el segundo caso, la seleccin de las
observaciones se realiza en funcin de la variable independiente, los aos de estudio.
No se comete, por tanto, ningn error, puesto que el investigador no predetermina los
valores de la variable dependiente. Es posible que entre los individuos que cuentan con
menos de 5 aos de estudio haya personas que hayan ledo muchos libros y otros
ninguno. La nica consecuencia de la seleccin de observaciones que se lleva a cabo es
que las conclusiones a las que se llegan slo son vlidas para los individuos que tienen
menos de 5 aos de estudios.

16. Un investigador quiere estudiar cmo influye la renta per cpita de un pas en la
probabilidad de que sea una democracia. Su hiptesis es que a mayor renta, ms
probable es la democracia. Para contrastar su hiptesis estudia los pases de la Unin
Europea. Discute el diseo de la investigacin.

Puesto que todos los pases de la Unin Europea son democracias, el diseo de
investigacin contiene un sesgo de seleccin: la seleccin no permite que se produzca
ninguna variacin en la variable dependiente, la existencia de democracia. La
conclusin (errnea) a la que se llegara sera que la renta per cpita no importa en
que se establezca una democracia, puesto que todos los pases estudiados, sea cual sea
su renta per cpita, son democracias. Para poder estimar adecuadamente este efecto
causal sera necesario que se estudiaran tambin pases no democrticos, esto es, fuera
de la Unin Europea.

17. Un investigador observa que los individuos mayores de 18 aos en Espaa dedican
menos horas a la semana a practicar deporte que los menores de 18. Su conclusin es
que el derecho de sufragio (que se concede a los 18 aos) causa una menor propensin a
practicar deporte. Discute en trminos metodolgicos esta conclusin.

La relacin aparentemente causal entre tener el derecho de sufragio y el deporte es


espuria. No hay ningn mecanismo causal que pueda justificarla. La correlacin entre
las dos variables se debe a que son efectos de una causa comn: la edad. Los mayores
de 18 aos practican menos deporte que los menores de edad y, al mismo tiempo, son
los que pueden votar.

18. Prescindir de una variable independiente relevante en la explicacin de un fenmeno


siempre provoca un sesgo en el efecto de las restantes variables independientes
consideradas. Verdadero o falso? Por qu?

Falso. La omisin de una variable independiente relevante slo provoca un


sesgo en el efecto de las incluidas cuando existe alguna correlacin entre ellas: cuanto
mayor sea la correlacin, mayor ser el sesgo. De todos modos, y desde un punto de
vista emprico, resulta sumamente difcil encontrar dos variables independientes
relevantes que tengan una correlacin igual a cero.

10. Glosario

Correlacin: Asociacin entre dos variables.


Correlacin/relacin espuria: Relacin aparentemente causal entre la variable
dependiente y la independiente que en realidad no existe, puesto que est causada por
una tercera variable.
Explicacin: Una afirmacin sobre por qu ha sucedido un resultado.
Hiptesis: Respuesta tentativa o provisional a una pregunta de investigacin. En el
anlisis causal, es la conjetura sobre la relacin entre una o ms variables
independientes y la dependiente.
Hiptesis nula: Es la hiptesis que se quiere rechazar en una investigacin y que
normalmente postula que no existe ninguna relacin entre dos variables. Cuando se
rechazar, se hace para aceptar la
Hiptesis alternativa: Es la hiptesis de nuestro modelo terico que establece la
existencia de una relacin entre dos variables.
Inferencia: El proceso de usar los datos para extraer conclusiones ms amplias sobre
conceptos e hiptesis que son el objeto de la investigacin.
Inferencia causal: El proceso de conseguir conclusiones sobre la causalidad de acuerdo
con los datos observados.
Inferencia descriptiva: El proceso de conseguir conclusiones descriptivas acuerdo con
los datos observados.
Observacin: Los valores de las variables para cada unidad de anlisis.
Operacionalizacin: La transformacin de las hiptesis tericas en operaciones de
investigacin emprica.
Parsimonia: Usar pocas variables en una teora o explicacin.

Pregunta de investigacin: Lo que intentamos comprender en la investigacin y que la


motiva.
Sesgo: Error sistemtico en la inferencia. Cuando existe un sesgo, los errores no se
cancelan y, por tanto, las inferencias no son vlidas.
Teora: Especulacin razonada y precisa sobre la respuesta que cabe dar a la pregunta
de una investigacin e incluso una declaracin de por qu tal respuesta es correcta.
Unidad de anlisis: Objetos sobre los que un investigador recoge los datos, como
personas, pases o sistemas electorales.
Validez externa: Grado con el que una inferencia causal o descriptiva para un
determinado conjunto de casos se puede generalizar a otros casos.
Validez interna: Se refiere a la calidad con la que se miden los conceptos implicados y
las relaciones entre los mismos dentro del modelo terico.
Variable: Caracterstica empricamente observable de algn concepto y que puede
tomar ms de un valor (si no, es una constante).
Variable dependiente: Lo que se intenta explicar en una investigacin.
Variable independiente: Una variable que influye en la variable dependiente.
Variable independiente clave: La variable independiente sobre la que se articula la
teora que evaluamos empricamente.
Variable independiente de control: Una variable independiente que tambin importa
para explicar la variable dependiente, pero que no es central en nuestra teora.

Potrebbero piacerti anche