Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Walter Sosa-Escudero2
Universidad de San Andrs y CONICET
Marzo de 2011
1. Introduccin
Desde la perspectiva de quienes se inician en la investigacin, y estn
acostumbrados a ser evaluados a travs de exmenes, (muy posiblemente, la
mayora de los estudiantes avanzados de ciencias sociales), investigar puede
sonar como algo simple y posiblemente engaoso. La prctica clsica del examen
consiste en responder una pregunta, en un contexto especfico proporcionado por
el docente o por el propio desarrollo de la asignatura. Es ms, la evaluacin
acerca de si es pertinente o no la respuesta recae sobre el docente. Por el
contrario, la actividad central de la investigacin consiste en formular una
pregunta y proveer una respuesta adecuada, en un contexto sobre el cual el
investigador tiene control, y en un marco interactivo, en donde las preguntas y
respuestas son evaluadas y reformuladas. Relegada a su mecnica elemental, y
Trabajo elaborado para la 4ta edicin del libro La Trastienda de la Investigacin,
compilado por Catalina Wainerman y Ruth Sautu. Agradezco a Catalina Wainerman,
Betina Duarte, Mariana Chudnovsky, Marina Navarro y Martin Cicowiez por sus
comentarios. Los errores y omisiones son de mi exclusiva responsabilidad. Contacto:
Walter Sosa-Escudero, Universidad de San Andrs, Vito Dumas 284 (B1644BID), Buenos
AiresArgentina. Ph :(54-11)-4725-7020. wsosa@udesa.edu.ar.
2 PhD en Economa, Universidad de Illinois. Profesor Asociado de la Universidad de San
Andrs. Investigador Independiente del CONICET. Profesor Titular de Econometra en
la Universidad Nacional de La Plata.
1
intelectuales que son propias de los exmenes. As y todo, y para sorpresa de los
iniciados, conducir a buen puerto una investigacin relevante requiere una gran
capacidad de gestin de recursos (tecnolgicos, financieros, humanos),
habilidades interpersonales, capacidad estratgica y de administracin de
riesgos, probada capacidad de comunicacin (oral y escrita),
adems de un
contexto que dio origen al estudio en cuestin, sus principales objetivos, logros y
productos cientficos. La seccin tres es la visita a la trastienda. Se describe en
primer lugar el stock de recursos (de conocimientos previos, humanos,
institucionales, etc.) existentes antes de empezar esta investigacin. Luego se
discuten una serie de ideas y teoras que fueron utilizadas como marco
conceptual para la investigacin, y cmo fue la toma de decisiones en torno a las
mismas. El proceso de establecer qu se investiga, qu no, y cmo, es complejo,
y ocupa un lugar central en este apartado. Al tratarse de una investigacin
emprica, el manejo de datos y los mtodos estadsticos tienen particular
relevancia, y son descriptos con detalle. Tambin se ahonda en el proceso de
conformacin de un equipo, en la divisin de roles, en la existencia, tcita o no,
de una estructura jerrquica interna, y en el manejo de las relaciones entre las
instituciones involucradas en el proceso. Finalmente, se describe la estrategia de
difusin de los resultados obtenidos. La seccin 4 ofrece algunas reflexiones
generales sobre este proceso, que se espera sean extrapolables a cualquier
investigacin emprica en ciencias sociales.
2. Contexto, objetivos, resultados, y produccin cientfica.
La investigacin que utilizaremos para los objetivos de este trabajo, consisti en
un anlisis emprico de la pobreza multidimensional en Amrica Latina y el
Caribe. Si bien focalizaremos en el proceso de elaboracin de la misma, resulta
inevitable discutir, aunque ms no sea brevemente, algunos resultados.
Ciertamente, una revisin detallada de los mismos nos aleja de los objetivos de
este captulo, por lo que referiremos a los artculos derivados de esta
investigacin, para mayor detalle.
En economa, y en varias disciplinas sociales, la mayora de los estudios
empricos sobre pobreza se basan en una caracterizacin extremadamente simple
de la misma, usualmente basada en la carencia de ingresos3. En su concepcin
ms simplificada, se entiende como pobre a un hogar o persona con ingresos por
debajo de cierto umbral, usualmente llamado lnea de pobreza. Claramente,
esta (sobre) simplificacin obedece a cuestiones puramente pragmticas. Mas all
de las conocidas dificultades que tienen las encuestas en captar adecuadamente
los ingresos de las personas (ver Gasparini, Sosa Escudero y Cicowiez (2010, Cap
3), los mismos se prestan a comparaciones simples y consistentes, tanto
3
Ver Gasparini, et al. (2010) para una discusin detallada de estos conceptos.
de
dificultades
conceptuales,
administrativas,
estadsticas
Pablo
empricos
concretos
que
permitan
evaluar
cuantificar
la
en
base
Alternativamente,
sopesar
alguna
todas
literatura
las
mas
dimensiones
incipiente
(Alkire,
intentaba
2008).
trabajar
10
11
permitiese tomar un primer contacto con una nueva base emprica, y que
explorase en forma abarcativa el bagaje conceptual heredado, asi como abordar
algunas preguntas como las descriptas en la seccin 2.
El primer escollo metodolgico fue el contacto con la Encuesta Gallup. El
primer encuentro con una base de datos voluminosa y poco explorada (por lo
menos para los fines de nuestra investigacin) es siempre motivo de gran
incertidumbre. Que los datos existan y que estn disponibles, es una afirmacin
que tiene sentido solo en el contexto especifico de los propsitos de una
investigacin. Mas claramente, la nica chance de poder aprender de los datos se
basa en que exista variabilidad suficiente en los mismos, como para que los
mtodos estadsticos puedan operar en forma confiable, que esa variabilidad sea
funcional a las premisas tericas que dan respaldo a la investigacin, y que
pueda garantizarse un mnimo de calidad. En definitiva, de la calidad y utilidad
de los datos, solo se aprende al momento de utilizarlos a los fines de la
investigacin de inters. Este es otro grueso error de principiantes: pensar que los
datos existen por el mero hecho administrativo o computacional de que se
encuentran fsicamente en alguna parte. A modo de ejemplo, y en relacin a las
ciencias experimentales, a fines de medir el efecto que tiene una droga sobre la
temperatura corporal, una enorme base de datos que registra dichas variables es
de limitada utilidad si, por ejemplo, la variabilidad en las dosis es muy limitada
(completamente intil, si a todas las personas se les asigna la misma cantidad de
droga), si las dosis no fueron asignadas en forma exgena (lo cual elimina la
posibilidad de medir efectos causales), si existen copiosas cantidades de datos
faltantes y en alguna forma sistemtica, o si las temperaturas corporales se basan
en instrumentos de medicin muy imprecisos. La validacin de los datos dentro
del contexto de la investigacin es un paso crucial en una investigacin emprica,
los datos no existen sino a partir del momento en el cual los mismos son puestos
a trabajar (exitosamente) a los fines de la investigacin.
Preveamos que esta etapa era crucial. Ex ante no podamos garantizar la
calidad de la informacin, lo cual podra atentar seriamente contra los objetivos
de la investigacin. En consecuencia, todas las primeras energas del proyecto se
abocaron al ejercicio de validar, administrativa, conceptual y estadsticamente, la
encuesta. Como se mencionase anteriormente, esto implic un esfuerzo
considerable, ya que la tarea consisti en cotejar resultados con fuentes ya
exploradas o validadas, como las encuestas oficiales de hogares.
12
13
del
ingreso
como
variable
representativa
del
bienestar.
14
fines de no alterar los objetivos iniciales del proyecto, se prefiri utilizar tcnicas
estndar que permitiesen una rpida implementacin, fcil comunicacin e
inmediata comparacin con resultados anteriores obtenidos con fuentes
alternativas, relegando a investigaciones posteriores el uso de mtodos ms
sofisticados y potencialmente ms ricos. Ms concretamente, nuestra impresin
era que innovar en los datos y en los mtodos podra conducir a confusiones que
impidiesen identificar las contribuciones relativas de ambas innovaciones.
Una segunda dificultad se relaciona con las barreras y preconceptos que
la economa tiene con el uso de mtodos multivariados. Llama la atencin que
esta rama de la estadstica (que incluye a los mtodos de clusters, el anlisis
discriminante y de correlaciones cannicas, los modelos de factores, entre varios
otros, ver Hardle y Simar (2003) para una revisin moderna de esta literatura)
ocupe un espacio mnimo en la caja de herramientas de los economistas. Toda
vez que las mismas ocupan un lugar considerable y creciente (a la luz de los
notorios avances computacionales y en tcnicas de data-mining) en disciplinas
cercanas, tales como la psicologa, la sociologa, el marketing o varias ramas
afines de la ingeniera. Ver Hastie, Tibshirani y Friedman (2009) para una
excelente revisin de la literatura de data mining. Un anlisis pormenorizado de
las razones que justifican esta cautela, excede claramente los objetivos de este
trabajo. Nos limitaremos a mencionar que las estrategias multivariadas en
economa, como los modelos de ecuaciones simultneas, o sus versiones ms
modernas como los vectores autorregresivos, fueron histricamente sujetos de
severas crticas en lo que se refiere a las dificultades que los mismos tienen en
identificar verdaderas relaciones causales (critica de Lucas), sin recurrir a
supuestos de difcil justificacin, emprica o terica6. Estas crticas se extienden,
casi en forma literal, a las estrategias de componentes principales o los modelos
de factores. Las mismas intentan representar un conjunto inicialmente grande de
variables a travs de unos pocos indicadores, lo cual parece ser un objetivo
emprico muy apropiado para los fines de nuestra investigacin. La principal
preocupacin que muchos investigadores tienen con respecto al anlisis de
factores se relaciona con las dificultades en interpretar coherentemente este
grupo reducido de variables. Habitualmente se apela a supuestos aparentemente
6
15
16
aplicados a la pobreza.
17
Como
A modo de ancdota, varios de los que nos formamos en economa en la dcada del
ochenta, realizamos inversiones sustanciales en enfoques como el de catstrofes, o en
tcnicas como rezagos distributivos, o estimacin bajo heterocedasticidad o
autocorrelacion, que a la fecha son de uso virtualmente nulo. Asi y todo, como con la
ropa o los discos, la ultima palabra en cuanto a la relevancia de estas inversiones, esta
todava por orse.
18
A modo de
19
20
21
que
lleva
cabo
el
equipo
de
investigacin
y,
Esta
la
relacin
inicial
alumno-docente
se
transforma,
muy
22
investigador.
Como
comentsemos
anteriormente,
cualquier
23
ocurren
en
un
contexto
de
enorme
incertidumbre,
24
25
Por el
26
Referencias
Alkire, S., 2008, Choosing Dimensions: The Capability Approach and
Multidimensional Poverty, Cap. 6 en Kakwani y Silber (2008b).
Angrist, J. y Pischke, J., 2008, Mostly Harmless Econometrics: An Empiricist's
Companion, Princeton University Press, Princeton, NJ.
Angrist, J. y Pischke, J., 2010, The Credibility Revolution in Empirical Economics:
How Better Research Design Is Taking the Con out of Econometrics, Journal of
Economic Perspectives, 24.
Caruso, G., Sosa Escudero, W. y
27
Fraiman R., Justel A. and Svarc M., 2008, Selection of Variables for Cluster
Analysis and Classification Rules, Journal of American Statistical Association,
103, 1294-1303.
Gasparini, L. y Gluzmann, P., 2009, Estimating income poverty and inequality
from the Gallup World Poll. The case of Latin America and the Caribbean,
Documento de Trabajo ECINEQ, Society for the Study of Economic Inequality.
Gasparini, L., Sosa Escudero, W. y Cicowiez, M., 2010, Pobreza y Desigualdad en
America Latina: Conceptos, Herramientas y Aplicaciones, mimeo.
Gasparini, L., Marchionni, M., Olivieri, S. y Sosa Escudero, W., 2008, Income,
Deprivation, and Perceptions in Latin America and the Caribbean: New Evidence
from the Gallup World Poll, mimeo, InterAmerican Development Bank.
Gasparini, L., Marchionni, M., Olivieri, S. y Sosa Escudero, W., 2009a,
Multidimensional Poverty in Latin America and the Caribbean: New Evidence
from the Gallup World Poll, con Leonardo Gasparini, Mariana Marchionni and
Sergio Olivieri. Documento de Trabajo CEDLAS No. 121.
Gasparini, L., Marchionni, M., Olivieri, S. y Sosa Escudero, W., 2009b, Objective
and Subjective Deprivation, en Graham, C. y Lora, E. (eds.), Paradox and
Perception: Measuring Quality of Life in Latin America, Brookings Institution
Press, Washington.
Hardle, W. y Simar, L., 2003, Applied Multivariate Statistical Analysis, Springer,
New York.
Hastie, T., Tibshirani, R. y Friedman, J., 2009, The Elements of Statistical
Learning: Data Mining, Inference, and Prediction, Second Edition, Springer, New
York.
Kakwani, N. y Silber, J., 2008a, Quantitative Approaches to Multidimensional
Poverty Measurement, Palgrave Macmillan, New York
28
29