Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
A PRUEBA
Claves para una evaluación docente exitosa
Cruz-Aguayo, Yyannú.
Profesores a prueba: claves para una evaluación docente exitosa / Yyannú Cruz-Aguayo,
Diana Hincapié, Catherine Rodríguez.
978-1-59782-368-5 (Rústica)
978-1-59782-369-2 (Digital)
Esta obra se encuentra sujeta a una licencia Creative Commons IGO 3.0 Reconocimiento-
NoComercial-SinObrasDerivadas (CC-IGO 3.0 BY-NC-ND) (http://creativecommons.
org/licenses/by-nc-nd/3.0/igo/legalcode) y puede ser reproducida para cualquier uso
no-comercial otorgando el reconocimiento respectivo al BID. No se permiten obras derivadas.
Cualquier disputa relacionada con el uso de las obras del BID que no pueda resolverse
amistosamente se someterá a arbitraje de conformidad con las reglas de la CNUDMI
(UNCITRAL). El uso del nombre del BID para cualquier fin distinto al reconocimiento
respectivo y el uso del logotipo del BID, no están autorizados por esta licencia CC-IGO y
requieren de un acuerdo de licencia adicional.
Note que el enlace URL incluye términos y condiciones adicionales de esta licencia.
Lista de gráficos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix
Agradecimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
v
vi PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
vii
LISTA DE GRÁFICOS
ix
AGRADECIMIENTOS
Profesores a prueba: claves para una evaluación docente exitosa es una publicación de la
División de Educación del Sector Social del Banco Interamericano de Desarrollo (BID).
Agradecemos especialmente a Norbert Schady, asesor económico del Sector Social, y
a Gregory Elacqua, economista principal de la División de Educación, quienes proporcio-
naron orientación y retroalimentación a lo largo de este proyecto. Agradecemos también
el apoyo de Emiliana Vegas, exjefa de la División de Educación, Sabine Rieble-Auborg, jefa
interina de la División de Educación; Marcelo Cabrol, gerente del Sector Social; Ana María
Ibáñez, asesora económica principal de la Vicepresidencia de Sectores y Conocimiento, y
Ana María Rodríguez, vicepresidenta de Sectores y Conocimiento.
Nuestros colegas de la División de Educación nos facilitaron los contactos con las auto-
ridades educativas de los países y brindaron retroalimentación útil en diversas etapas de la
producción de este estudio.
Varios investigadores participaron de la elaboración de los documentos de apoyo que
se utilizaron para este trabajo: María Camila Rivera apoyó la elaboración de un estudio sobre
sistemas de evaluación docente en América Latina y el Caribe; James Wyckoff y Verónica
Katz prepararon un estudio sobre sistemas de evaluación docente en Estados Unidos, y
Phillippa Codringley y Paul Crisp, del Centre for the Use of Research and Evidence in Edu-
cation (CUREE) produjeron un trabajo sobre los sistemas de evaluación docente en países
de alto desempeño educativo. Diana Paredes brindó asistencia en varias etapas del pro-
ceso, particularmente en la edición y diagramación del texto.
Agradecemos a los expertos en Educación y a las autoridades educativas de los siste-
mas educativos de América Latina y el Caribe, que conversaron con nosotras, resolvieron
nuestras dudas, y validaron gran parte de la información recolectada.
El libro recibió comentarios de revisores externos anónimos. Agradecemos también las
observaciones de los comentaristas y participantes en el Diálogo Regional de Políticas de
la Red de Educación del BID, especialmente de Santiago Cueto y Ximena Dueñas.
La edición estuvo a cargo de Claudia M. Pasquetti y de Alejandra Abrodos.
Los comentarios y opiniones que se expresan en esta publicación pertenecen a las
autoras, y no reflejan en forma alguna la visión del Banco Interamericano de Desarrollo ni
de su Directorio Ejecutivo.
xi
SOBRE LAS AUTORAS
xiii
xiv PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
CAPÍTULO 1
LA EVALUACIÓN DOCENTE:
IDENTIFICANDO LA EFECTIVIDAD
Y APOYANDO EL DESARROLLO
DE LOS MAESTROS
Una educación de calidad es indispensable para promover el bienestar de las personas, el
crecimiento económico y la reducción de las desigualdades sociales de los países. Por lo
tanto, no es de extrañar que los gobiernos de América Latina y el Caribe hayan realizado
esfuerzos importantes en las últimas décadas para aumentar la cobertura educativa. La
mayoría de los países de América Latina ha alcanzado una cobertura universal en la edu-
cación primaria, mientras que el 77% de los niños de 4 a 5 años y el 80% de los jóvenes de
15 a 17 años asisten a la escuela (BID-CIMA, 2019). Con el aumento en cobertura, los años
promedio de educación se incrementaron de prácticamente cero a comienzos del siglo XX
a nueve en la actualidad (Busso, Cristiá, Hincapié, Messina y Ripani, 2017).
A pesar de estos innegables avances, las habilidades de los estudiantes muestran que aún
hay grandes rezagos en la calidad educativa de los sistemas de la región. Por ejemplo, solo
aproximadamente un tercio de los alumnos de cuarto grado que participaron en las pruebas
del Tercer Estudio Regional Comparativo y Explicativo (TERCE) y un tercio de los alumnos
de 15 años que participaron en las pruebas del Programa para la Evaluación Internacional de
Alumnos (PISA, por sus siglas en inglés) lograron alcanzar un nivel mínimo de competencias
en matemáticas y lectura (Busso et al., 2017). Por ello, es necesario seguir avanzando en la
implementación de políticas que busquen mejorar la calidad educativa en nuestros países.
Entre los esfuerzos para lograrlo, se deben incluir políticas que abarquen los diferen-
tes aspectos que determinan dicha calidad. Por el lado de la oferta educativa, sin duda, una
1
2 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
presentes dentro de una misma escuela, en donde las prácticas pedagógicas y las habi-
lidades para promover el aprendizaje de los estudiantes son bastante diferentes entre
profesores. Esto lo han demostrado estudios recientes para Estados Unidos (Hanushek y
Rivkin, 2010; Chetty, Friedman y Rockoff, 2014a); y para varios países de América Latina
(Araujo et al., 2016; Bruns y Luque, 2015).
Las evaluaciones docentes pueden ayudar a identificar las diferencias de desempeño
entre los profesores. Además, el uso adecuado de sus resultados puede otorgar la infor-
mación necesaria para aprovechar al máximo sus fortalezas, buscar superar las falencias,
y potenciar la excelencia en la profesión. No obstante, para que las evaluaciones docen-
tes cumplan estos propósitos y sean realmente aceptadas, implementadas y utilizadas en
cualquier sistema educativo se requiere que sean válidas y confiables. Esto significa que la
información que surja de ellas debe ser objetiva, estar realmente asociada a su labor diaria
y reflejar aspectos fundamentales dentro de los procesos de aprendizaje de los estudian-
tes, de modo que permita que tanto los propios docentes como las autoridades educativas
entiendan y reconozcan cuáles son las fortalezas y debilidades en la labor del docente.
Más aún, solo si los resultados de las evaluaciones son utilizados adecuadamente en progra-
mas de desarrollo profesional y/o en incentivos en la carrera —que incluyan bonificaciones,
ascensos o remoción de las aulas dependiendo del caso— se puede mejorar la calidad de la
enseñanza y el aprendizaje de los estudiantes.
Distintos sistemas educativos en el mundo están llevando a cabo grandes esfuerzos en este
aspecto y transformando los sistemas de evaluación docente. Diversos factores pueden expli-
car la evolución que este tipo de evaluaciones han tenido en los últimos años. El bajo impacto
de los indicadores tradicionalmente usados para medir el impacto de los docentes sobre los
aprendizajes de los estudiantes —como el nivel de educación o experiencia del docente— ha
incentivado la búsqueda de medidas más directamente relacionadas con su productividad y
efectividad. La introducción de políticas laborales que buscan incentivar un mayor esfuerzo y
asignar una mayor responsabilidad del desempeño de los alumnos a los propios docentes tam-
bién puede explicar este cambio. Finalmente, la búsqueda de la excelencia académica en los
sistemas educativos y la evidencia de la importancia de la labor docente en ella es otro factor
que se encuentra detrás del énfasis reciente en torno a los sistemas de evaluación docente.
Los países de América Latina no son ajenos a esta transformación y en los últimos
años varios de ellos han puesto en marcha iniciativas para mejorar los procesos de evalua-
ción docente en el sistema educativo público. Incluso hay algunos modelos de evaluación
docente en la región que pueden considerarse de “segunda generación” y que se encuen-
tran en distintos niveles de desarrollo e implementación.1 Aprovechando esta coyuntura y
1 Como se explicará en detalle más adelante, este tipo de evaluaciones, consistentes con las múltiples
labores que llevan a cabo los docentes, se caracterizan por contar con una multiplicidad de instru-
mentos y evaluadores con el objetivo de entender en detalle los distintos aspectos de los procesos de
enseñanza, y buscando asegurar las características de validez y confiabilidad antes mencionadas.
4 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
hacer que los alumnos aprendan a su propio ritmo y puede adaptarse dinámicamente a su conoci-
miento. Este tipo de software puede permitir que los maestros conozcan las fortalezas y debilidades de
sus estudiantes y puedan brindar un servicio más personalizado.
6 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
Aunque son muchos los avances y también las diferencias que se observan en los
sistemas de evaluación de la región, el análisis del capítulo 4 permite destacar tres conclu-
siones fundamentales en torno a las evaluaciones docentes en América Latina y el Caribe.
Primero, existen discrepancias notables en cuanto a los niveles de meritocracia definidos
dentro de los estatutos que rigen la profesión docente en la región, que incluyen aspectos
relacionados con los procesos para el ingreso, los ascensos y la salida de la carrera, entre
otros. Al enfocar el análisis en la mención o no de la evaluación docente en el estatuto, se
encontró que existen países en donde ni siquiera se hace referencia a ella, mientras que
hay otros países cuyos estatutos tienen de manera explícita y detallada los cuatro tipos de
evaluaciones consideradas en el estudio. Segundo, la situación de facto no necesariamente
refleja la situación de jure en lo que se refiere a la implementación y al uso de resultados
de la evaluación docente. Así, aunque la legislación defina la obligatoriedad y las conse-
cuencias en términos laborales de las evaluaciones docentes en las distintas etapas de la
profesión de manera detallada, estas evaluaciones no siempre se aplican, o si se aplican,
no se implementan de la forma en que están en la legislación o no todas las consecuencias
que de ellas se deben derivar efectivamente ocurren. Tercero, a pesar de estas debilidades,
es claro que un gran número de países de la región está haciendo esfuerzos valiosos que
buscan mejorar la atracción, retención y profesionalización de la fuerza docente a través
de procesos de evaluación. De hecho, en un número no despreciable de países, se aplican
o se están comenzando a aplicar evaluaciones que se pueden catalogar como de segunda
generación. Además, en algunos países la evaluación ha venido acompañada de investi-
gaciones acerca de los procesos e impactos de la implementación de estos sistemas de
evaluación, lo cual permite optimizar los instrumentos y protocolos utilizados en ellos. Es
precisamente este tipo de información la que permitirá a los directivos y autoridades del
sector tomar decisiones informadas que se encaminen hacia la mejora de la calidad de la
educación brindada.
Finalmente, el quinto capítulo concluye el estudio con algunas recomendaciones de
política y las claves para tener una evaluación docente exitosa. Se espera que estas suge-
rencias, junto con los demás análisis presentados, resulten útiles para guiar y potenciar los
esfuerzos llevados a cabo en la región en el tema de evaluación docente, y para alcanzar
una mejora continua de la calidad de la enseñanza para todos los estudiantes de nuestra
región.
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 9
CAPÍTULO 2
9
10 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
1 Para esta teoría de cambio se asume que los docentes con mayores habilidades pedagógicas y discipli-
nares efectivamente las despliegan en las aulas y de esta forma pueden mejorar el aprendizaje de sus
estudiantes. Asimismo, se asume que los docentes cuentan con los recursos pedagógicos y el material
de apoyo necesarios para poder ser efectivos en el aula.
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 11
Impactos en
habilidades
pedagógicas
y disciplinares
de los maestros
Evaluaciones
de desempeño que: Impactos
Mejora en la positivos en
Otorguen información la calidad educativa
válida y confiable. eficacia del cuerpo
docente brindada a los
Usen adecuadamente estudiantes
los resultados.
Impactos
en la composición
y retención de la
fuerza docente
resume lo que investigaciones rigurosas han encontrado en cuanto a los impactos del diseño
y de la puesta en marcha de evaluaciones docentes en algunos sistemas educativos.
Al ser la docencia una actividad compleja, una evaluación holística de la labor docente
requiere una combinación de distintos instrumentos. Esto implica que al momento de
diseñar los sistemas de evaluación docente las autoridades educativas deben escoger los
instrumentos que serán utilizados, pero también deben definir los pesos que se le asigna-
rán a cada uno de ellos. Estas decisiones tendrán repercusiones en los costos del sistema,
el nivel de aceptación por parte de los diferentes actores y el éxito de su implementación.
Por ejemplo, asignar mayor peso a un determinado indicador cuantitativo puede generar
el aumento en la presión alrededor de los resultados obtenidos de este y puede hacer más
probable la distorsión de procesos que, se supone, debería monitorear (Campbell, 1979).
Aunque la revisión detallada de los instrumentos disponibles, sus características y los
requisitos para su correcta aplicación está fuera del alcance de este trabajo, es valioso
mencionar los instrumentos utilizados más comúnmente y lo que las principales investiga-
ciones han evidenciado acerca de ellos.
i. Aunque son conscientes de que los exámenes de conocimiento no capturan todos los
objetivos que se busca alcanzar en las escuelas y que en consecuencia deberían ser
parte de la labor docente, destacan que estas pruebas sí miden el aprendizaje de sus
estudiantes, que es uno de los objetivos más importantes.
ii. La literatura de impacto ha demostrado que medidas de valor agregado presentes de
los docentes son buenos predictores de medidas de valor agregado en el futuro (Kane
et al., 2013; Araujo et al., 2016). Por ejemplo, para el caso de Ecuador, Araujo et al.
(2016) encuentran que, ademas de la experiencia y calidad de las interacciones de los
docentes con sus alumnos dentro del aula de clase, el valor agregado también es una
medida que predice los aprendizajes estudiantiles.
iii. Las medidas de valor agregado docente están correlacionadas con aspectos de desa-
rrollo individual de sus estudiantes en el largo plazo como la asistencia a la educación
superior, los salarios que devengan cuando tienen 28 años y el embarazo adolescente
(Chetty et al., 2014a y 2014b).
Por otro lado, existen argumentos en contra del uso de pruebas estandarizadas de
conocimiento a los estudiantes como parte de la evaluación docente, que se detallan
a continuación.
1. El primero de ellos señala que las pruebas estandarizadas no pueden identificar todo el
conjunto de resultados que se busca alcanzar en el proceso de enseñanza-aprendizaje.
2. El segundo estipula que, en parte, el desempeño de los estudiantes está fuera del
alcance absoluto del docente y depende de los propios estudiantes y de su motivación
e interés al presentar las pruebas. Dado que los docentes no pueden efectivamente
impactar sobre todos los resultados en las pruebas a estudiantes, no es conveniente
asignar un peso importante a los resultados en dichas pruebas.
3. El tercer argumento indica que, incluso si se acepta el aprendizaje disciplinar como
una medida fundamental a alcanzar dentro del sistema educativo, es preciso consi-
derar que las medidas de valor agregado no suelen estar disponibles para todos los
docentes dentro de los sistemas educativos sino únicamente para aquellos cuyos alum-
nos presentan los exámenes estandarizados en los cuales se deben basar. Este no es
un punto menor ya que, por ejemplo, en países desarrollados la información solo está
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 15
disponible para alrededor del 20% de los docentes y en América Latina el porcentaje
es aún menor (Wyckoff y Katz, 2018).2
4. El cuarto argumento apunta que, como toda medida, su confiabilidad depende de la
validez de los exámenes de conocimiento que responden los estudiantes, factor que no
siempre está asegurado (Lockwood et al., 2007; Papay, 2011).
5. El quinto establece que cuando hay incentivos vinculados con los resultados de la eva-
luación de aprendizajes de los estudiantes el diseño debe ser cuidadoso para asegurar
que no se conviertan en estrategias de enseñanza solo para los exámenes (“teaching to
the test”) o que incluso puedan estimular la copia o la trampa3 para aumentar los pun-
tajes y obtener así los incentivos (Koretz, 2015; Stecher, 2002).
6. El sexto argumento indica que el cálculo de las medidas de valor agregado es complejo,
incluso metodológicamente, y requiere de decisiones que pueden alterar los resultados,
como por ejemplo la elección del tipo de controles de características socioeconómicas
de los estudiantes y de las escuelas que se incluyen en sus estimaciones (Donaldson y
Papay, 2015). Más aún, hay dudas respecto del grado de confiabilidad del uso de estas
medidas, ya que su correlación anual es relativamente baja y solo con promedios a lo
largo de cinco años aumenta a niveles aceptables (Kane, Kerr y Pianta, 2014).
7. Por último, la séptima crítica está vinculada con el momento en el que medidas de
efectividad docente basadas en estos resultados se pueden estimar y el uso que de
ellas puede surgir. En general, estas medidas se calculan y se difunden al finalizar el
año académico, o incluso después. Más importante aún, otorgan poca información que
les permita a los docentes y a la autoridad educativa entender en qué aspecto puede
y/o debe mejorar cada docente. De acuerdo con Smith y Kubacka (2017), los docentes
consideran que sistemas de evaluación que se basan de manera significativa en este
instrumento tienen un impacto limitado en sus estrategias de enseñanza y lo ven como
un proceso meramente administrativo y poco formativo.
Si bien muchas de estas críticas pueden ser válidas en ciertos contextos, la clave para
una evaluación docente exitosa está en encontrar la forma de aprovechar las ventajas que
estas pueden ofrecer, e incorporar en el diseño mismo de la evaluación formas de mitigar
los elementos negativos que usualmente se les atribuyen.
2 Para superar, en parte, la crítica respecto de que estas medidas están disponibles solo para un porcentaje
pequeño de docentes algunos sistemas educativos han optado por utilizar medidas de valor agregado
promedio a nivel de escuela. Sin embargo, en estos casos la distancia entre la efectividad del docente y
medidas de resultado agregadas es aún mayor, lo cual le resta conveniencia al uso de estrategias como esta.
3 Por ejemplo, los docentes podrían excluir a algunos estudiantes de menor rendimiento académico de las
pruebas para intentar obtener un puntaje mejor.
16 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
académicos que esperan que sus alumnos alcancen. El superior jerárquico del docente
revisa y aprueba estos objetivos y al finalizar el año académico evalúa, junto con el docente,
el progreso efectivamente alcanzado por los alumnos. En función de dicho progreso, el
docente recibe una calificación de su desempeño. La ventaja más evidente de este tipo
de instrumento en comparación con aquellos basados en pruebas estandarizadas a los
estudiantes es que puede establecerse para todos los docentes del sistema educativo, al
margen de la materia o el grado en que los docentes dictan sus clases. Sin embargo, su
nivel de estandarización y objetividad es bajo. Aunque, en general, están sujetos a objetivos
o competencias definidos previamente por cada sistema, para cada área del conocimiento
y grado educativo, en última instancia dependen de la autonomía que cada docente tiene
en su definición y en la rigurosidad de los superiores al evaluar el nivel en que estos objeti-
vos han sido cumplidos.4 De hecho, Lachlan-Haché et al. (2015), en uno de los estudios más
completos sobre el tema, mencionan que la literatura especializada permite concluir que la
implementación de este instrumento no solo es subjetiva sino que demanda mucho tiempo
por parte de los docentes y superiores y está muy débilmente correlacionada con los resul-
tados de los estudiantes en pruebas estandarizadas. A pesar de esto, como quedará claro
en las revisiones de experiencias internacionales, es uno de los instrumentos más utilizados
en gran parte de los sistemas educativos de Estados Unidos y el peso que se le asigna den-
tro de la calificación final que se les da a los docentes es significativo. 5
4 Aunque el progreso estudiantil puede evaluarse por medio de pruebas específicas, el uso de medidas
de objetivos de aprendizaje se fundamenta, precisamente, en la dificultad de evaluar a todos los estu-
diantes, en todas las materias, todos los años mediante pruebas estandarizadas.
5 De acuerdo con Steinberg y Donaldson (2016), el 52% de los estados y el 39% de los distritos más gran-
des en Estados Unidos utilizan este instrumento. Además, el peso relativo asignado a este instrumento
varía entre el 8% y el 25% dentro del puntaje total de la evaluación.
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 17
System (Stallings y Knight, 2003); o TEACH (Molina et al. , 2018), muchas veces los sistemas
deben encontrar la rúbrica más adecuada de acuerdo con los objetivos de la evaluación, el
contexto en el que esta se enmarca y el tiempo y los recursos disponibles para realizarla.6
En ese sentido, Donaldson y Papay (2015) y Steinberg y Donaldson (2016) señalan que este
diseño implica la toma de decisiones importantes como, por ejemplo, el número de observacio-
nes que tendrá cada docente, el tiempo de duración de cada observación, si serán observaciones
programadas o sorpresa, quién será el encargado de efectuarlas (un superior, un par dentro de
la escuela, un par de otra escuela o un experto externo a la escuela) y el tipo de entrenamiento
que se le dará a cada observador o codificador, entre otros aspectos. Estas decisiones, además,
tienen consecuencias directas tanto en la validez y la confiabilidad de la información recolec-
tada por medio de este instrumento (Cohen y Goldhaber, 2016) como en el tiempo y el dinero
que requerirá su implementación. Por ejemplo, el instrumento de observación CLASS genera
datos sobre la calidad de la interacción pedagógica de los profesores, el apoyo emocional a los
estudiantes y la manera en la que los docentes gestionan la clase, mientras que el instrumento
de Stallings captura principalmente el uso que hacen los docentes del tiempo de instrucción y
algunas prácticas pedagógicas. Debido a que el instrumento CLASS busca capturar un mayor
espectro del comportamiento docente, su implementación, aunque es más costosa que la del
instrumento de Stallings, permitiría una mayor retroalimentación que mejore las prácticas peda-
gógicas de los maestros evaluados. Sin embargo, como argumentan Bruns, De Gregorio y Taut
(2016), en sistemas educativos de América Latina, donde un porcentaje alto de docentes aún no
alcanza los tiempos efectivos de enseñanza mínimos sugeridos por la OCDE, puede ser benefi-
cioso comenzar con la implementación de instrumentos más sencillos.
A pesar de estas complicaciones, la utilización de la observación en clase como
instrumento tiene varias ventajas. A diferencia de las medidas de valor agregado, las obser-
vaciones en clase se enfrentan a menores niveles de controversia por parte de los docentes,
para quienes los resultados obtenidos a través de pruebas estandarizadas restringen los
objetivos de la labor docente a una única medida y además no les dan información rele-
vante acerca de qué mejorar en su labor diaria o cómo hacerlo. La observación en clase,
por el contrario, está arraigada en la profesión y si es implementada correctamente puede
aportarle al docente información concreta acerca de sus debilidades y fortalezas. Estudios
como el Proyecto de Medición de la Efectividad Docente (MET, por sus siglas en inglés) o
el de Rockoff y Speroni (2010), entre otros, sugieren que estas medidas son válidas —están
correlacionadas con el desempeño estudiantil en pruebas estandarizadas— y confiables
cuando se diseñan e implementan correctamente.
Aunque es el instrumento más antiguo y, posiblemente, uno de los más utilizados en el
mundo, aún no existe suficiente evidencia rigurosa sobre sus resultados (Cohen y Goldhaber,
2016). Por ejemplo, se desconoce si sus resultados también están relacionados con impactos
6 Las observaciones en aula más efectivas son aquellas que se enfocan en lo que hace efectivamente el
docente en el aula, es decir, en la calidad de los procesos que ocurren en ella y menos en aspectos de
infraestructura.
18 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
de largo plazo en los estudiantes, algo que, se sabe con certeza, ocurre con las medidas de
valor agregado (Chetty et al., 2014b). Además, se requiere mayor investigación acerca de cuá-
les son las prácticas cruciales que se deben medir y por lo tanto fortalecer mediante programas
de formación. Del mismo modo, si bien las conclusiones del proyecto MET reseñadas más ade-
lante son valiosas, se necesita aún mayor investigación con respecto al diseño más adecuado
y costo-eficiente a ser aplicado dependiendo del objetivo específico que se quiera alcanzar.
Portafolio docente
Un portafolio docente es la compilación de materiales por parte del docente que permite
entender el proceso de enseñanza que este lleva a cabo durante el año lectivo. La ventaja
de esta herramienta es que abre la posibilidad de una visión holística de la labor docente
al incluir componentes de planeación, evaluación y reflexión de su labor y al recolectar evi-
dencia acerca de la calidad de su práctica y de cómo esta se adapta a las necesidades y el
progreso de sus estudiantes y depende de estos elementos. Por ejemplo, en Chile el por-
tafolio está compuesto de tres módulos: i) descripción de la práctica docente y reflexión
acerca de su quehacer docente, ii) una clase grabada y iii) descripción del trabajo colabo-
rativo entre docentes y reflexión al respecto.
Se trata de un instrumento que, al parecer, resulta particularmente útil para la auto-
rreflexión. Sin embargo, son pocas las investigaciones que han evaluado su efectividad.
Una excepción es el estudio para Estados Unidos de Goldhaber y Anthony (2007), quie-
nes evalúan el impacto del National Board for Professional Teaching Standards (NBPTS),
el sistema de certificación docente voluntario más reconocido en el país, que se basa en la
elaboración de un portafolio de evidencias de enseñanza. Los resultados alcanzados a par-
tir de datos del estado de Carolina del Norte sugieren que el sistema es capaz de identificar
a docentes más efectivos tanto en el conjunto de quienes aplican al programa como entre
los que nunca lo hacen. También existe evidencia de las ventajas del portafolio para Amé-
rica Latina: en el análisis acerca de la correspondencia entre las distintas herramientas de la
evaluación docente en Chile, Taut et al. (2016) encuentran una correlación positiva y signi-
ficativa de los resultados que obtienen los docentes en el puntaje del portafolio y medidas
de valor agregado de sus estudiantes. No obstante, como el portafolio en Chile incluye una
clase grabada, además de las evidencias y reflexiones sobre la práctica docente y el trabajo
colaborativo, no es claro si la correlación positiva proviene principalmente de los compo-
nentes de evidencias y reflexiones o si se debe al componente de observación en clase.
Evidencia reciente surgida del proyecto MET y de estudios posteriores que usan sus datos
(Polikoff, 2015) sugiere que las encuestas a estudiantes pueden ser un complemento impor-
tante en las evaluaciones docentes. Como ocurre con los demás instrumentos, si están bien
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 19
diseñadas, las encuestas pueden tener una ventaja en términos de confiabilidad pues dependen
de información recolectada por varios actores, otorgan información desde otra perspectiva y
son mucho menos costosas que los otros instrumentos. Si bien existe la posibilidad de que se
enfrenten a algunos problemas de sesgo, estudios para estudiantes y docentes en educación
superior indican que son un instrumento válido (Benton y Cashin, 2012). Otros de los instru-
mentos que utilizan los distintos sistemas educativos son las entrevistas con los directores o
superiores jerárquicos, las entrevistas con pares y las encuestas a padres, entre otros.
Las pruebas estandarizados aplicadas a los propios docentes son una herramienta útil que,
dependiendo de su diseño, permite identificar su conocimiento pedagógico o disciplinar.
Como quedará claro en los capítulos posteriores, el uso de este tipo de instrumento es
común dentro de los sistemas educativos de América Latina y el Caribe, particularmente
en las evaluaciones asociadas al ingreso a la carrera y en aquellas requeridas para ascender.
Es un instrumento común también en los sistemas educativos dentro de Estados Unidos
donde es un requisito para la certificación docente. Probablemente, la mayor ventaja de
este instrumento es que, una vez su diseño asegure que las preguntas incluidas efectiva-
mente evalúan si el docente cumple o no con los estándares de desempeño requeridos,
su implementación es mucho más sencilla y menos costosa que la de los otros instrumen-
tos arriba referenciados. Además, es el único instrumento para el cual hay evidencia causal
positiva de la región que muestra cómo su implementación puede efectivamente mejorar
el desempeño estudiantil (Ome, 2012; Brutti y Sánchez, 2017; Estrada, 2019).
con cerca de 3.000 docentes de siete distritos escolares en Estados Unidos entre 2009 y
2013. Se analizaron tres tipos de instrumentos: observaciones de clases (con protocolos de
observación tanto genéricos como específicos para ciencias y matemáticas), encuestas de
percepción a estudiantes y medidas de ganancias de aprendizaje de estudiantes con base
en exámenes estandarizados.8 Una de las conclusiones que se pueden extraer del estudio
es la validez de las encuestas a estudiantes y de los protocolos de observación en clase
que, cuidadosamente diseñados y aplicados, permiten identificar y dar retroalimentación
a prácticas pedagógicas que a su vez están correlacionadas con el nivel de aprendizaje de
los estudiantes. En ese marco, a continuación, se reseñan tres grandes preguntas que los
investigadores buscaron responder en el proyecto MET (2013).
El primer cuestionamiento gira en torno de si medidas de enseñanza efectiva pueden
identificar, o no, a los docentes que propician mayores aprendizajes en sus estudiantes.
Para averiguarlo, los analistas recogieron medidas de eficiencia de docentes con base en
observaciones en clase, encuestas a estudiantes y medidas de valor agregado ajustadas
por las características socioeconómicas de los estudiantes para el período académico
2009–10 y construyeron una medida compuesta. En el siguiente año llevaron a cabo un
experimento donde asignaron estudiantes a cada profesor de manera aleatoria para des-
pués determinar si aquellos estudiantes asignados a docentes identificados como más
efectivos de acuerdo con la medida compuesta aprendían más. Los resultados sugieren
que efectivamente estos estudiantes tuvieron un desempeño mejor en pruebas estandari-
zadas tradicionales e incluso en pruebas con mayores niveles de requerimientos analíticos
que estudiantes asignados a docentes menos efectivos.
La segunda gran pregunta que buscaron responder en el proyecto MET se refiere a la
ponderación óptima que cada instrumento debe tener dentro de una evaluación de desem-
peño. Debido a la complejidad del trabajo docente, es claro que realizar una evaluación
con una multiplicidad de instrumentos de calidad es mejor que hacer una evaluación con
un único instrumento. Sin embargo, no existen muchos estudios que permitan identificar
qué combinación es la más efectiva. Los investigadores optaron por cuatro ponderacio-
nes distintas que asignaban pesos alternativos a las medidas de valor agregado, a las
observaciones en clase y a las encuestas a estudiantes. De acuerdo con los autores, una
ponderación equitativa entre las tres medidas logra la mayor correlación con resultados en
8 Los protocolos de observación en clase incluyeron el Framework for Teaching de Danielson; Classroom
Assessment Scoring System (CLASS), de la Universidad de Virginia; Mathematical Quality of Instruction
(MQI), de la Universidad de Michigan; Protocol for Language Arts Teaching Observations (PLATO), de la
Universidad de Stanford. Además, se utilizaron protocolos específicos de ciertas áreas de conocimiento,
como el Quality of Science Teaching (QST), de la Universidad de Stanford, y el UTeach Teacher Obser-
vation Protocol (UTOP), de la Universidad de Texas-Austin, para matemáticas y ciencias. Las encuestas
a estudiantes fueron las Tripod Student Perception Survey, desarrolladas por Ron Ferguson. Los exá-
menes de conocimiento incluyeron los estatales y el Stanford 9 Open-Ended Reading Assessment, el
Balanced Assessment of Mathematics (BAM) y los ACT QualityCare para álgebra, inglés y biología.
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 21
9 Como era de esperarse, los autores encontraron que una ponderación que asigna el 80% del peso a
medidas de valor agregado basadas en pruebas estandarizadas estatales es la que mejor predice el
desempeño futuro de los estudiantes en estas mismas pruebas. Sin embargo, no necesariamente es la
mejor opción para capturar otros aspectos de la docencia. De hecho, es la combinación que obtiene la
menor correlación con otro tipo de pruebas estandarizadas aplicadas a estudiantes.
10 Por otra parte, el estudio encontró que el puntaje obtenido por los docentes en exámenes de conoci-
miento específico, que incluían temas disciplinarios y pedagógicos, no estaba correlacionado con los
aprendizajes de los estudiantes.
22 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
El informe final del proyecto contiene valiosos aprendizajes para todos los interesados
en el tema (Stecher et al., 2018).11 El primero de ellos se relaciona con la implementación de
estos sistemas de evaluación. Aunque en todas las escuelas participantes se diseñaron y
aplicaron sistemas de evaluación docente basados en rúbricas de observación en clase y,
donde era posible, en resultados académicos de los estudiantes, su implementación no fue
sencilla. Por ejemplo, en la mayoría de las escuelas las observaciones estaban a cargo de
los directores, lo cual aumentó de manera importante su carga laboral. Esta situación llevó
a que en algunos sistemas se bajara el número o la duración de las observaciones o bien se
designara como agente evaluador otro actor interno sin el mismo nivel de preparación para
llevar a cabo dicha labor. Además, como sucede en muchos de los sistemas que se analizan
en los siguientes capítulos, la mayoría de los docentes fue catalogada en las categorías de
desempeño más eficientes, hecho que disminuyó el poder de diferenciación de dicho ins-
trumento en cuanto a la calidad de los docentes.
De manera consistente con otros estudios, el proyecto encontró que la implementación
de la evaluación docente aumentó la tasa de salida del sistema de los docentes poco efec-
tivos. Sin embargo, no logró la retención o la contratación de docentes más efectivos. Esto
puede explicarse por el hecho de que el uso de los resultados no fue el esperado. Por ejem-
plo, aunque se implementaron algunas políticas que asociaban los resultados a ascensos de
carrera o bonificaciones estas no se dieron en la extensión que se esperaba, su diseño dife-
ría de lo sugerido por los investigadores al inicio del proyecto y en algunos casos estaban
asociadas a aspectos que no eran importantes para los docentes.12 Por otra parte, los siste-
mas buscaron integrar programas de desarrollo profesional basados en los resultados, pero
la investigación mostró que no supieron cómo llevarlos a cabo y su implementación no fue
completa. Según explicaron las autoridades de los establecimientos que participaron del
proyecto, los resultados y la retroalimentación de estos no estaban suficientemente deta-
llados para diseñar programas de desarrollo profesional adecuados, no existían programas
que sirvieran como modelos y los sistemas educativos no tuvieron el tiempo ni los recursos
monetarios para diseñarlos. Además, cuando los programas generales de desarrollo profe-
sional y formación en servicio existían los docentes no tenían obligación de asistir, no había
supervisión acerca de quiénes los tomaban y tampoco existía un control sobre si las prác-
ticas pedagógicas de los docentes que participaban en los programas mejoraban como
resultado de ello.
Teniendo en cuenta estos resultados, no sorprende que la investigación no encon-
trara impactos en el acceso a docentes más efectivos, en el desempeño de estudiantes en
Dos estudios para Estados Unidos sugieren que sistemas de evaluación docente holísticos
pueden tener impactos importantes en la composición y la retención de la fuerza docente.
13 Resulta interesante también analizar la literatura que evalúa el impacto de los incentivos monetarios
individuales o grupales que reciben los profesores a partir del desempeño de sus estudiantes. Como no
se centra en evaluar las destrezas pedagógicas y disciplinares de los docentes, ese análisis no se incluye
en este trabajo. Sin embargo, vale mencionar estudios como Springer (2009), Fryer (2013), Bruns y
Luque (2015) y Barrera-Osorio y Raju (2017).
24 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
El primer estudio es el de Dee y Wyckoff (2015), quienes analizan el impacto que tuvo
el sistema de incentivos atados a la evaluación docente (conocido como IMPACT) en las
escuelas públicas del distrito de Columbia (EPDC) en la rotación de docentes catalogados
como efectivos y no efectivos por el mismo sistema y en el desempeño de los docen-
tes que permanecen después de haber sido evaluados. El sistema de evaluación IMPACT
fue introducido de manera general en el año académico 2009–10 con los objetivos explí-
citos de mejorar la calidad de la enseñanza y el aprendizaje de los alumnos. En el marco
de IMPACT, los docentes recibían una calificación final que dependía en gran medida de
resultados obtenidos a partir de observaciones en clase rigurosas atadas a los estánda-
res de desempeño del distrito (teaching and learning framework). La calificación iba de
100 a 400 puntos y el puntaje obtenido definía la ubicación de cada docente en una de
cuatro posibles categorías de desempeño: no efectivo (100–175), mínimamente efectivo
(176–250), efectivo (251–350) y altamente efectivo (351–400).
El sistema contemplaba cinco observaciones en el año: tres las realizaba un directivo
de la escuela (director o asistente del director) y dos las efectuaba un experto externo. La
única observación anunciada era la primera, que la llevaba a cabo el director de la escuela.
Para un grupo reducido de docentes (el 17%) cuyos estudiantes presentaban pruebas estan-
darizadas también se incluían medidas de valor agregado basado en esas pruebas. Para los
que no tenían la posibilidad de cálculo de valor agregado se incorporaba una medida de
objetivos de aprendizaje para los estudiantes fijados por el docente y el director. Al finali-
zar el año los administradores de la escuela evaluaban qué tanto se habían alcanzado esos
objetivos. Además, existían dos medidas adicionales: el compromiso con el colegio y la
comunidad y una medida de valor agregado para el colegio. Finalmente, el diseño incluyó
mecanismos de mejoras por medio de tutores para los docentes que, de acuerdo con los
resultados obtenidos, así lo requirieran.
El sistema comprendía dos tipos de incentivos basados en los resultados que cada
docente obtenía en la evaluación. El primero consistía en un incentivo monetario con una
bonificación para aquellos docentes clasificados como altamente efectivos. Asimismo, el
sistema aseguraba un aumento permanente en la base salarial (equivalente a entre tres y
cinco años de servicio) para los docentes catalogados como altamente efectivos en dos
oportunidades seguidas y retiraba de manera inmediata a los docentes clasificados como
no efectivos. El segundo tipo de incentivo estaba relacionado con la estabilidad laboral. En
ese marco, los docentes clasificados en la categoría de mínimamente efectivo por dos años
consecutivos eran removidos del sistema también. Así, ambos incentivos de IMPACT no
solo estaban ligados a medidas multidimensionales de desempeño académico asociadas
a mayores niveles de confiabilidad y transparencia —como se explicó anteriormente— sino
que además se basaban en acciones que los propios docentes controlan de forma directa.
Para estimar el impacto que tuvo la evaluación los investigadores compararon la per-
manencia y el desempeño de docentes cuyos puntajes en la evaluación del año anterior
estuviesen cerca de los límites que separaban a un docente efectivo de uno mínimamente
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 25
efectivo (alrededor de 250 puntos) y en el límite entre los docentes clasificados como efec-
tivos y los altamente efectivos (350 puntos).14 Los resultados demuestran que la amenaza
de despido aumentó el retiro voluntario de docentes clasificados como mínimamente efec-
tivos en la primera evaluación. Además, el desempeño de los docentes clasificados en esta
categoría que permanecieron en el sistema mejoró en la evaluación siguiente, medido por
el puntaje de la evaluación en años posteriores. Por último, los autores encuentran que los
incentivos monetarios entregados a aquellos ubicados en la cola superior de la distribución
fueron efectivos al lograr mejorar sus resultados en las siguientes evaluaciones también.
Por otra parte, el estudio revela que los impactos crecen en el tiempo, a medida que las
bonificaciones y las amenazas se vuelven más creíbles. Sin embargo, los autores no pue-
den diferenciar qué parte de los impactos provino exclusivamente del uso de la evaluación
y qué parte de los incentivos.
Sartain y Steinberg (2016) responden a una pregunta similar a partir del análisis de los
impactos de un sistema de evaluación docente piloto, llamado Excellence in Teaching Project
(EITP). Este programa, aplicado en un grupo de escuelas públicas de Chicago, tenía como
objetivo mejorar la calidad de aprendizaje de los estudiantes a través de una mejora en la
retroalimentación brindada por los directores a sus profesores para de esa manera mejorar
las prácticas docentes en clase. El programa utilizó la rúbrica de Danielson (Framework for
Teaching, FFT) e implementó un entrenamiento profundo que capacitaba a los directores en
el uso correcto de la misma. Por otra parte, los docentes no estaban sujetos a un beneficio o
un castigo específicos basados en los resultados obtenidos. Los autores analizan el impacto
del sistema de evaluación en dos aspectos: i) la salida de los docentes de la escuela en la que
trabajan, pero no del sistema de escuelas públicas de Chicago (rotación dentro del distrito) y
ii) la salida definitiva de los docentes del sistema de escuelas públicas de esa ciudad.
En este caso, para encontrar los impactos se llevó a cabo un experimento aleatorio por
el cual se eligieron 92 escuelas públicas: 44 de esas escuelas recibieron el tratamiento en el
período académico 2008–09 y las 48 escuelas restantes, en el año académico siguiente. Por
lo tanto, se trata de una evaluación de muy corto plazo en la que los indicadores de inte-
rés se compararon un año después de que el programa fue implementado en las primeras
44 escuelas. Los resultados sugieren que el EITP no tuvo ningún impacto en la tasa promedio
de rotación de docentes dentro del distrito. Sin embargo, al separar los docentes de acuerdo
con su nivel de eficacia (según evaluaciones previas a 2009), los autores encuentran que la
probabilidad de salida del sistema de escuelas públicas de Chicago aumenta para aquellos
clasificados con nivel no satisfactorio o satisfactorio, resultado muy similar al hallado reciente-
mente por Stecher et al. (2018). También determinan que la probabilidad de salida del sistema
es mayor para aquellos docentes con pocos años de experiencia. Así, los autores concluyen
que un sistema de evaluación como este tiene el potencial de retirar del sistema educativo a
aquellos docentes con bajos niveles de eficacia. Por otra parte, los autores señalan que los
nuevos docentes contratados en las escuelas tratadas, al igual que aquellos que permane-
cieron en ellas después de implementado el sistema de observación y retroalimentación de
prácticas pedagógicas, tienen un mayor puntaje en el FFT que los docentes que se fueron.
Ambos estudios, por lo tanto, sugieren que observaciones de clase con rúbricas atadas
a estándares claros, observadores cuidadosos e intensamente entrenados y una retroali-
mentación continua para los docentes de sus prácticas pueden lograr mejoras en la calidad
de la enseñanza y retirar de las aulas a los docentes con prácticas deficientes. Más aún,
para el caso de Chicago, el entrenamiento de los propios directores en cómo evaluar a sus
docentes produjo impactos positivos en la calidad de los docentes contratados en el sis-
tema. Estos resultados, además, son congruentes con evidencia previa disponible también
para Estados Unidos en la que se observa que la entrega de información a los directores
de escuela acerca de la efectividad relativa de los docentes, medida a partir de estimativos
de valor agregado, impacta en la retención de docentes poco efectivos y, a través de este
canal, en los resultados de los estudiantes (Rockoff et al., 2012).
Como se puede apreciar en el gráfico 2.1, el objetivo final de la evaluación docente es ase-
gurar que el sistema cuente con docentes excelentes que promuevan de manera efectiva
el aprendizaje de los alumnos. El estudio de Taylor y Tyler (2012) analiza esta posibilidad
con datos de las evaluaciones docentes realizadas en Cincinnati, Estados Unidos. Los auto-
res aprovechan la aplicación progresiva de las evaluaciones para comparar un grupo de
docentes que participó del programa primero con otro grupo que empezó a participar
más adelante. El programa de evaluación del estado contemplaba cuatro observaciones
de clases metódicas durante un año académico. Tres de ellas las realizaba un par experto,
externo al colegio —escogido según sus propios niveles de eficacia y designado para tal
fin de manera expresa—, y la cuarta la efectuaba el director u otro directivo de la misma
escuela. Las observaciones se basaban en la rúbrica de Danielson; en tanto que todos los
observadores contaban con un entrenamiento riguroso acerca de cómo llevarlas a cabo. La
primera observación se anunciaba durante la semana en la que ocurriría, pero las siguien-
tes observaciones no eran informadas con anticipación. Al terminar el proceso anual cada
docente recibía una calificación, en el marco de un reporte de desempeño final, en uno de
cuatro niveles: distinguido, eficaz, básico y no satisfactorio. Los resultados de las evalua-
ciones tenían pocas implicaciones en la estabilidad de la carrera: niveles excelentes podían
estar atados a promociones, niveles bajos originaban la asignación de pares para un pro-
grama de mejoramiento, y en muy pocos casos generaban la terminación del contrato
laboral. Además, cerca del 90% de los docentes fue ubicado en las dos primeras catego-
rías, lo que ratifica el escaso impacto en términos de carrera que las evaluaciones per se
podían traer.
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 27
Los autores utilizan una metodología que les permite analizar cómo cambia la efecti-
vidad de cada docente antes de pasar por el proceso de evaluación, durante el mismo y
después de haberlo atravesado.15 Así, encuentran que la productividad de los docentes,
medida como el aprendizaje basado en el puntaje de un estudiante de su clase en el área
de matemáticas, aumenta durante el año en el que son evaluados e incluso se incrementa
en mayor proporción en los años posteriores a la culminación del proceso de evaluación.
Un estudiante sube su puntaje en pruebas estandarizadas de matemáticas en 0,1 desvia-
ciones estándar más que un estudiante con características socioeconómicas similares y
niveles de conocimiento previos similares que fue asignado al mismo profesor, pero antes
de que este pasara por el proceso de evaluación. Aunque los datos no permiten identificar
los canales a través de los cuales se pueden explicar los impactos, los autores sugieren que
se basan en el aprendizaje que los docentes obtienen gracias al proceso evaluativo acerca
de su rendimiento y sus prácticas pedagógicas, y el subsecuente desarrollo de habilidades
adicionales, así como el mayor esfuerzo futuro.16
Steinberg y Sartain (2015) analizan el impacto del sistema de evaluación docente piloto
EITP en Chicago (que ha sido descrito más arriba) sobre el aprendizaje de los estudiantes. Como
se ha mencionado antes, el piloto comenzó en 2008–09 en 44 escuelas primarias (primera
cohorte) y en 2009–10 se incluyeron 48 escuelas adicionales (segunda cohorte). Los autores
encuentran que los estudiantes que asistían a los colegios de la primera cohorte obtienen mejo-
res resultados en lectura y matemáticas que aquellos estudiantes que asistían a colegios cuyos
docentes fueron tratados en la segunda cohorte, aunque únicamente los resultados en lenguaje
son estadísticamente significativos. Además, hallan que dicha ventaja se mantiene incluso des-
pués de haber sido tratados los de la segunda cohorte y que los impactos fueron mayores para
escuelas donde asisten estudiantes con mayores niveles de ingreso promedio.
En sus conclusiones los autores resaltan tres puntos importantes. El primero es que se
pudieron obtener resultados inmediatos en el aprendizaje estudiantil, gracias a que el sis-
tema estaba basado en observaciones de clase realizadas por los directores de las escuelas,
quienes después discutían de manera detallada los resultados y las posibles estrategias de
mejoramiento con los docentes. Sin embargo, este esquema tuvo dos implicaciones: i) el
entrenamiento de los directores, y en general de la persona encargada de la observación y
la retroalimentación, debe ser intenso y de la mejor calidad; ii) la implementación de la eva-
luación y las discusiones posteriores generó en los directores una presión muy importante
15 En términos técnicos, los autores utilizan una estrategia de efectos fijos por maestro. Además, en sus
estimaciones tienen en cuenta los puntajes previos de sus alumnos, puntajes que no entraban en el pro-
ceso de evaluación del estado de Cincinnati que estaban analizando.
16 Este mismo análisis se llevó a cabo con docentes en el área de lengua a través de pruebas de lectura. En
este caso los autores no encuentran ningún impacto positivo y no ofrecen explicaciones al respecto, al
margen de sugerir que los estudiantes aprenden y practican la lectura en contextos que están fuera de
la escuela mucho más que matemáticas y que, por lo tanto, la eficacia o las diferencias en docentes en
esta área de la enseñanza son de por sí menores.
28 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
en tiempo y trabajo que los formuladores de políticas deben tener en cuenta. Finalmente,
los autores señalan que, en general, la implementación de la evaluación se debilitó de
manera significativa a partir del segundo año, hasta el punto de que el programa nunca fue
aplicado de manera general luego del piloto. Esto, de acuerdo con ellos, explica los meno-
res impactos observados para la cohorte dos y pone de manifiesto la necesidad de contar
con un sistema fuerte para que sea posible obtener resultados positivos. En ese sentido,
resaltan la importancia de una implementación adecuada y fiel al diseño original.
Adnot et al. (2017) también hallan resultados positivos en el aprendizaje de los estu-
diantes al analizar el impacto del retiro de profesores poco eficientes incentivado por el
programa IMPACT.17 Los autores encuentran que el retiro de docentes en el distrito mejoró
en 0,08 desviaciones estándar y 0,04 desviaciones estándar el desempeño de los estu-
diantes en matemáticas e inglés, respectivamente. Incluso si solo se tiene en cuenta el
retiro de los docentes clasificados como poco efectivos en la evaluación, las mejoras pro-
medio en los resultados académicos de los estudiantes aumentan a un 21% y un 14% en
cada materia, respectivamente. Además, los autores mencionan que la recomposición en
la efectividad del grupo de docentes en el sistema fue mayor en escuelas con altos niveles
de población vulnerable, por lo cual las mejoras en el aprendizaje se concentran en estos
estudiantes. A su vez, esto implica que los impactos en este tipo de alumnos son aún mayo-
res y equivalen a cerca de un 35%–65% de su aprendizaje promedio en un año.
Para América Latina la evidencia acerca de los impactos que ha generado la evalua-
ción docente es mucho menor y se concentra en casos particulares. Sin embargo, parte
de ella sugiere que las evaluaciones docentes pueden provocar impactos positivos sobre
los aprendizajes de los estudiantes. Por ejemplo, Ome (2012) y Brutti y Sánchez (2017)
en Colombia y Estrada (2019) en México encuentran que evaluaciones en la entrada a
la carrera docente tienen impactos marginales positivos en indicadores de eficiencia y
calidad de la educación que reciben los estudiantes. Para Chile, aunque no es posible cata-
logarlo como una evaluación de impacto del sistema de evaluación docente, el estudio de
Taut et al. (2016) halla evidencia que sugiere que los aprendizajes logrados por los estu-
diantes cuyos docentes obtuvieron puntajes más altos en el instrumento del portafolio son
mayores que los aprendizajes alcanzados por los estudiantes asignados a otros docentes.
Aunque no analiza un sistema de evaluación docente como tal, un estudio relacionado
es el de Santibáñez et al. (2006), pues estima el impacto que generó en México la introduc-
ción del programa Carrera Magisterial. Este programa voluntario de incentivos salariales,
implementado en el país entre 1992 y 2015, daba la posibilidad a los maestros de alcan-
zar una promoción o ascenso horizontal. Las promociones horizontales son aquellas en las
que el prestigio, las funciones, las responsabilidades y el salario de los docentes pueden
17 Los autores utilizan información a nivel de grado-escuela y emplean una metodología de diferencias en
diferencias que evalúa el impacto que el retiro de profesores de ese grado-escuela particular, incluidos
aquellos que salieron del sistema debido a IMPACT, tiene en el rendimiento estudiantil.
POR QUÉ ES IMPORTANTE EVALUAR A LOS DOCENTES Y CÓMO HACERLO BIEN 29
incrementarse sin necesidad de que los profesores deban abandonar las aulas de clase o
el enfoque en la docencia. Para poder acceder a un ascenso, los maestros interesados eran
evaluados anualmente en seis dimensiones: i) grado máximo de estudios, ii) años de anti-
güedad en el servicio, iii) desempeño profesional de acuerdo con la calificación otorgada
por sus pares, iv) puntaje en las evaluaciones estatales y federales de los cursos de desa-
rrollo profesional, v) puntaje en las pruebas de conocimiento de docentes y vi) puntaje
promedio en pruebas estandarizadas de sus alumnos. Según la clasificación final obtenida,
los maestros eran catalogados en seis posibles rangos que a su vez determinaban el monto
de las bonificaciones salariales a las que tenían derecho.
Los autores analizan tanto la confiabilidad y la consistencia interna de las pruebas apli-
cadas como los impactos que el programa provocó en la calidad educativa que recibieron
los alumnos. En ese sentido señalan que, si bien las pruebas de maestros estaban alineadas
con el currículo y presentaban grados de confiabilidad y consistencia interna adecuados,
en realidad el nivel de complejidad de las preguntas era bajo y había espacio para mejo-
rar. Respecto de los exámenes a estudiantes, los autores mencionan que la confiabilidad
y la consistencia interna eran menores que los observados en las pruebas docentes, y la
habilidad cognitiva exigida también era escasa. Teniendo en cuenta esto, los impactos de
Carrera Magisterial en aprendizaje estudiantil son mixtos. Aunque en secundaria se hallan
mejoras de entre el 3% y el 15% de una desviación estándar en las pruebas estandariza-
das de alumnos cuyos maestros fueron clasificados en el grupo de mayores incentivos, no
se encuentra ningún impacto para estudiantes de primaria. Incluso se advierten algunos
impactos negativos para alumnos de primaria cuyos maestros ya habían sido clasificados
en el grupo de mayores incentivos en años anteriores.
En su conjunto, la evidencia acerca de las evaluaciones docentes indica que tienen el
potencial de mejorar la calidad educativa en los sistemas en los que se aplican. Sin embargo,
para que esto efectivamente ocurra es esencial que los formuladores de políticas tengan en
cuenta que el diseño y la implementación son factores fundamentales. Si el diseño y la imple-
mentación de las evaluaciones docentes no aseguran que los instrumentos y la información
que surja de ellas sean válidos y confiables, es poco probable que los recursos invertidos
en ellas tengan frutos verdaderos. Incluso si esta primera condición se cumple es impor-
tante también el uso que se les dé a los resultados que arrojen las evaluaciones. Aunque hay
evidencia que sugiere que la efectividad docente mejora a través de la participación en pro-
cesos evaluativos, la teoría de cambio indica con claridad que es necesario incluir procesos
formativos o incentivos en la carrera ligados a las evaluaciones. Esto implica que las decisio-
nes que es preciso tomar alrededor del tema no solo son complejas sino también costosas.
Entender cómo han enfrentado esta disyuntiva otros sistemas educativos puede ser informa-
tivo y enriquecedor para la toma de decisiones futuras. Esto es precisamente lo que se busca
en los siguientes dos capítulos, en los que se analiza de qué manera sistemas educativos de
países que se considera que gozan de un buen desempeño educativo y 19 países de América
Latina han enfrentado estos dilemas de política pública educativa y docente.
CÓMO SE EVALÚA A LOS DOCENTES EN LOS SISTEMAS EDUCATIVOS EXITOSOS 31
CAPÍTULO 3
1 Este análisis se basa en gran parte en los documentos de antecedentes producidos por Wyckoff y Katz
(2018) y CUREE (2018) para el proyecto “Midiendo la efectividad docente”, y en el estudio reciente de
Steinberg y Donaldson (2016), quienes resumen los sistemas de evaluación docente de 50 estados y
25 distritos escolares de Estados Unidos.
31
32 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
Singapur, República de Corea y Estonia. Se seleccionaron estos países por su alto desem-
peño en pruebas estandarizadas para estudiantes y/o porque cuentan con diseños
novedosos de evaluación docente. En Estados Unidos se analizan los sistemas de Den-
ver Public Schools (DPS), District of Columbia Public Schools (DCPS), New Haven Public
Schools (NHPS) y New York City Public Schools (NYCPS) y los estados de Nuevo México
y Tennessee. Estos se eligieron porque incorporan medidas de valor agregado en sus
evaluaciones docentes.
Para entender las decisiones finales en torno al diseño y a la implementación de los
sistemas de evaluación docente, es importante comenzar por conocer la historia que se
encuentra detrás de cada uno de los casos analizados. En el caso de Estados Unidos, el
desarrollo de los sistemas de evaluación de desempeño docente, que utilizan una combina-
ción de instrumentos y que buscan entender y diferenciar las prácticas pedagógicas en las
escuelas, es un fenómeno relativamente reciente. De acuerdo con Wyckoff y Katz (2018),
para impulsar la introducción de estos sistemas influyó una combinación de al menos tres
factores nacionales e internacionales. En primer lugar, la evidencia de pruebas de conoci-
miento estandarizadas, nacionales e internacionales, existentes desde los años ochenta en
adelante demostró que la calidad de la educación que brindaba el sistema no era la ideal
y que era preciso poner en marcha acciones concretas para mejorarla. En segundo lugar,
algunos estudios del área de educación demostraban que: i) los docentes eran el insumo
escolar más importante de todos para el desempeño académico de los estudiantes (Aaron-
son, Barrow y Sander, 2007); ii) la eficiencia/calidad de los docentes en el país variaba de
manera importante incluso a nivel de la escuela (Aaronson, Barrow y Sander, 2007; Rivkin,
Hanushek y Kain, 2005; Rockoff, 2004), y iii) la evaluación docente en las escuelas del país
era simple, calificaba a la mayoría del cuerpo docente con un desempeño satisfactorio y
no aportaba retroalimentación valiosa que permitiera mejorar la calidad de la enseñanza
(Weisberg et al., 2009). En tercer lugar, la clara evidencia brindada por los dos puntos
anteriores creó el espacio para que se promovieran y financiaran programas específicos
con el objetivo de mejorar la calidad educativa de las escuelas y el desarrollo de sistemas
de evaluación docente detallados. 2
El flujo de nuevos fondos federales desde comienzos del milenio, unido a la presión de
diversos sectores, influyó para que muchos estados y distritos escolares de Estados Uni-
dos reformaran los sistemas de evaluación docente de manera importante. Además de
incluir múltiples instrumentos que permitieran identificar el desempeño de los docentes,
en muchos casos ataron también los resultados a consecuencias en términos monetarios
o laborales. La idea, por supuesto, era basar el diseño y la implementación de estos siste-
mas en la evidencia disponible, que sentaba las bases para asegurar sistemas de evaluación
2 Tres programas conocidos que surgieron en respuesta a la evidencia académica y el sentido de urgencia
con respecto a la necesidad de mejorar la calidad educativa en el país incluyen Race to the Top (2009),
el Teacher Incentive Fund (2006) y el No Child Left Behind (2001).
CÓMO SE EVALÚA A LOS DOCENTES EN LOS SISTEMAS EDUCATIVOS EXITOSOS 33
3 Así, en cierta medida es el caso más parecido a lo que ocurre en la región latinoamericana donde coexis-
ten distintos tipos de evaluaciones vigentes en cada país cada una con distintos propósitos, tal y como
quedará claro en el siguiente capítulo.
34 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
A diferencia de estas dos modalidades, los restantes cuatro casos analizados cuentan
con sistemas de evaluación mucho menos centralizados y detallados. El sistema de evalua-
ción docente vigente en la provincia de Ontario (Canadá) es de 2002 y su última reforma se
realizó en 2010. Se trata del tercer sistema educativo en términos de un mayor nivel de cen-
tralización en las decisiones y requisitos que debe incorporar una evaluación. Sin embargo,
a diferencia de los otros dos casos mencionados anteriormente, desde su inicio, la evalua-
ción en Ontario ha buscado sobre todo un único objetivo: el desarrollo profesional a través
de una evaluación diagnóstica que otorgue retroalimentación de sus prácticas de aula. En
cuanto al nivel de centralización, a este le sigue Reino Unido, cuyo sistema, desarrollado
en 2000 y reformado en 2006 y 2012, buscaba inicialmente asegurar la satisfacción labo-
ral y altos niveles de excelencia en el cuerpo docente. Aunque la regulación del país detalla
algunos principios básicos con los que debe contar la evaluación, en realidad la responsa-
bilidad de esta recae en los cuerpos colegiados a nivel de cada institución.
De todos los sistemas analizados, el de Nueva Zelanda es el más reciente, y su implemen-
tación debía comenzar en 2018. Tanto su diseño como su implementación pueden presentar
variaciones en las diferentes escuelas, pero el sistema debe basarse en guías especialmente
ideadas por la autoridad central. Finalmente, en Estonia el sistema de evaluación que la
legislación obliga a aplicar es a nivel de la escuela y no a nivel central. Esto concuerda con el
hecho de que los docentes del país gozan del mayor nivel de autonomía de todos los países
miembros de la Organización para la Cooperación y el Desarrollo Económicos (OCDE). A su
vez, implica que poco se sabe de los criterios utilizados en las evaluaciones de las escuelas y
aún menos de los docentes. Sin embargo, el gobierno emite unas guías que buscan orientar
las decisiones de los directores con la inclusión de la observación de clases de sus docentes
como un instrumento dentro de la evaluación interna de los colegios.
A pesar de las claras diferencias en cuanto a su historia, es posible observar tres aspec-
tos fundamentales de los sistemas de evaluación docente para los 12 casos aquí expuestos.
Específicamente, el eje del análisis de estos sistemas educativos está centrado en tres
aspectos concretos: i) los instrumentos utilizados en cada uno de los casos; ii) los pesos
que las autoridades educativas asignan a cada uno de dichos instrumentos dentro del pun-
taje final y, por último, iii) las consecuencias ligadas a los resultados de la evaluación. Esto,
permitirá que el lector entienda cómo en estos casos de éxito se tomaron decisiones fun-
damentales al momento del diseño y de la implementación de los sistemas de evaluación
docente, y además posibilitará un análisis de las principales similitudes y diferencias que
existen en los sistemas de evaluación docente de la región.
CÓMO SE EVALÚA A LOS DOCENTES EN LOS SISTEMAS EDUCATIVOS EXITOSOS 35
los docentes sean evaluados al menos una vez cada cinco años —aunque deben realizar
un plan de aprendizaje anual—, de acuerdo con lo que decida el director de la institución
educativa donde trabajen. Por su parte, tanto en Reino Unido como en Nueva Zelanda las
evaluaciones docentes deben ser anuales y, acorde con lo que se explicó anteriormente,
la legislación vigente les deja a los directores un espacio flexible para acomodarlas, de
acuerdo con lo que consideren más conveniente para sus docentes y escuelas.
En Singapur y República de Corea las evaluaciones son anuales y su estructura está
mucho más coordinada por las autoridades centrales. En Singapur, aunque los docentes
son evaluados por su supervisor directo de manera regular, la evaluación formal la lleva
a cabo un panel de supervisores compuesto por el director, el subdirector y los jefes de
departamento, quienes los califican de manera colectiva. En República de Corea, los direc-
tores son los encargados de asegurar que las directrices impartidas por el Ministerio de
Educación en torno a las evaluaciones se cumplan. Finalmente, en Estonia la evaluación
interna de la institución debe llevarse a cabo cada tres años, aunque cada año debe ela-
borarse un reporte de progreso interno. Además, los docentes pueden aplicar de manera
voluntaria a procesos que les permitan ascender en la carrera, así como también a proce-
sos de certificación cuyas características son definidas por las escuelas y por la asociación
de docentes del país, respectivamente.
Aunque la periodicidad y obligatoriedad son aspectos esenciales que permiten enten-
der de manera general el funcionamiento de los sistemas de evaluación en cada caso, una
de las decisiones fundamentales que deben tomar las autoridades educativas de cada sis-
tema tiene que ver —como quedó claro a partir del capítulo anterior— con los tipos de
instrumentos que se utilizarán. El cuadro 3.1 resume los instrumentos empleados para las
evaluaciones docentes en cada uno de los 12 sistemas aquí analizados. Debido a la histo-
ria que se encuentra detrás de cada sistema, y que ha sido reseñada anteriormente, no es
de extrañar que se vean reflejadas las importantes diferencias que existen en cuanto a la
selección de instrumentos en cada caso.
La primera conclusión evidente del análisis de la información es que en los sistemas
estudiados de Estados Unidos las evaluaciones docentes suelen incluir una multiplicidad
de instrumentos, mientras que esto no ocurre en la mitad de los demás sistemas de la
OCDE analizados en este capítulo. La primera excepción es Nueva Zelanda, país en donde
los docentes, además de estar sujetos a la observación en clase, deben llevar a cabo tam-
bién una autoevaluación que incluye un portafolio con evidencia que demuestre que el
docente efectivamente está alcanzando los estándares exigidos en la profesión.4 Lejos de
los otros cuatro sistemas, se encuentran Singapur y República de Corea, cuyas evaluacio-
nes estructuradas abarcan el uso de al menos cuatro instrumentos. Para estos dos países,
el sistema de evaluación vigente incluye, además de la observación en clase, el análisis de
(30%). Por lo tanto, no es de extrañar que en cuatro de los seis casos aquí analizados
se incluyan como instrumentos de la evaluación medidas de desempeño estudiantil en
exámenes estandarizados. 5 Las excepciones tienen lugar en Nuevo México y la ciudad de
Nueva York en donde lo que se utiliza como medida de aprendizaje estudiantil es el instru-
mento asociado a los objetivos de aprendizaje.
Como también se observa en el cuadro 3.1, de los países de alto desempeño el único
que incorpora medidas de desempeño estudiantil es Singapur, aunque República de Corea
tiene en cuenta a los estudiantes, al incluir encuestas aplicadas a ellos. Este último ins-
trumento se utiliza también en alrededor del 17% de los estados y distritos de Estados
Unidos. De hecho, tan solo en los casos de New Haven y de la ciudad de Nueva York no
se emplean encuestas estudiantiles dentro de la evaluación docente. Es notorio también
que todos los casos analizados para Estados Unidos, excepto el de New Haven, incluyan
como instrumento una medida con pocos niveles de estandarización como son los logros
de los objetivos de aprendizaje. Finalmente, Denver, DCPS, New Haven y Nuevo México
emplean como instrumentos formularios que indagan acerca del nivel de profesionalismo
del docente medido en aspectos como su puntualidad, el cumplimiento de sus responsa-
bilidades, el trabajo en equipo, e incluso el cuidado de su apariencia. Es posible que este
tipo de instrumento sea muy similar a otros instrumentos utilizados por varios países de
la región, los cuales, aunque sin duda aportan alguna información acerca del docente, es
poco probable que permitan entender cuáles son sus fortalezas y debilidades disciplinares
y pedagógicas, factores que impactan en la calidad de la enseñanza brindada.
Aunque en el caso de Ontario, Reino Unido y Estonia, los sistemas de evaluación incluyen
también reuniones con los supervisores, estas, más que instrumentos específicos, se utilizan
para obtener información básica del docente, coordinar las actividades de observación y entre-
gar los resultados finales de la evaluación. Por ejemplo, en Ontario (Canadá) el director de la
escuela debe realizar una reunión previa a la observación para explicarle al docente los detalles
de esta última, y una reunión posterior, donde se analizan los resultados, calificaciones genera-
les y estrategias a seguir. En el caso del Reino Unido, la reglamentación solo exige la observación
y una entrevista con el docente en donde se definen los objetivos laborales. Finalmente, como
ya se mencionó, para Estonia el sistema de evaluación se centra en el funcionamiento general
de la escuela y no en cada docente de manera específica. A pesar de esto, la revisión permi-
tió concluir que acaso la observación sea el instrumento más común utilizado en ese país.
Dada la preponderancia del uso de la observación en clase como instrumento en
todos los casos aquí analizados, cabe detallar aspectos relacionados con su diseño e
5 Es importante aclarar que la información requerida para la inclusión de medidas de valor agregado o de
crecimiento de percentiles estudiantiles en los sistemas de evaluación en Estados Unidos solo está dis-
ponible para cerca del 20% de los docentes en el país. Por tanto, aunque se mencione que en un estado
o distrito particular se utiliza alguno de estos instrumentos, esto no implica que todos los docentes de
dichos sistemas sean evaluados con esa herramienta.
CÓMO SE EVALÚA A LOS DOCENTES EN LOS SISTEMAS EDUCATIVOS EXITOSOS 39
6 Véase https://educationcouncil.org.nz/content/observations.
40 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
exactas. Es interesante también el caso del DCPS, ya que al comienzo exigía que todos los
docentes fuesen calificados por observadores externos dos veces al año, pero esta moda-
lidad tan deseable fue eliminada del proceso en 2016 debido a los altos costos monetarios
que implicaba.
Al analizar este instrumento se debe también revisar el número de observaciones obli-
gatorias dentro de cada proceso. Como lo demostró el estudio MET (2013), las variaciones
en este aspecto afectan de manera importante la confiabilidad de la información recogida.
Así, para Estados Unidos se encontró que en un extremo se encuentra Denver, donde se
requiere una única observación formal y una observación informal, y en la otra punta se
encuentra Tennessee, donde se requieren seis observaciones cada año. En el medio de
estos dos casos se hallan la ciudad de Nueva York, que obliga a tener una observación
formal y tres informales; los sistemas de DCPS y Nuevo México, donde se requieren un
máximo de tres observaciones formales, y New Haven, que demanda dos observaciones
formales y tres informales.
Como ya se resaltó, casi la totalidad de los casos analizados en Estados Unidos uti-
lizan como segundo instrumento alguna medida de rendimiento estudiantil. Al igual que
sucede con las observaciones en clase, existe una gran variación en el uso de este tipo de
información estudiantil dentro de las evaluaciones docentes de Estados Unidos. Aunque
DCPS, Tennessee y Nuevo México utilizan medidas de valor agregado de los docentes, su
diseño es distinto en cada caso. Por ejemplo, mientras que en DCPS se estima el valor agre-
gado para los docentes de matemáticas e inglés del 4º al 10º grado, en Tennessee y Nuevo
México se considera el desempeño estudiantil en una mayor variedad de materias. De
manera similar, mientras que en el cálculo del estimador del valor agregado DCPS incluye
como controles algunas características socioeconómicas de los estudiantes, Tennessee y
Nuevo México no las tienen en cuenta. Las diferencias de estos tres casos en comparación
con Denver son aún mayores, ya que el instrumento empleado por este distrito, aunque
recurre a información estudiantil, se basa en percentiles de crecimiento en lugar de hacerlo
en medidas de valor agregado.
Para los países que utilizan una multiplicidad de instrumentos en sus observaciones, es
importante entender el peso que le asignan a cada uno de ellos, ya que, como lo demos-
tró la investigación de MET (2013), esta decisión tiene impactos importantes en la validez
del sistema. La información disponible solo permite llevar a cabo este análisis para el caso
de los sistemas de evaluación docente dentro de Estados Unidos. Como se observa en el
cuadro A1 del apéndice para el caso general de Estados Unidos y en el cuadro 3.2 para los
seis casos particulares aquí analizados, el instrumento de observación en clase es el que en
promedio recibe el mayor peso dentro de las evaluaciones docentes de ese país, llegando a
más del 50% y el 37% respectivamente. Queda claro así que la observación en clase no solo
CÓMO SE EVALÚA A LOS DOCENTES EN LOS SISTEMAS EDUCATIVOS EXITOSOS 41
CUADRO 3.2 | P
esos asignados a cada instrumento utilizado en las evaluaciones
docentes de algunos estados y distritos de Estados Unidos
Resultados de Encuestas a
Distrito/ Observación exámenes a Objetivos de estudiantes
estado en clase estudiantes aprendizaje y/o padres Profesionalismo Otro
Denver 30% 10% 30% 10% 10% 10%
DCPS 30% 35% 15% 10% 10%
New Haven 40% 50% 10%
Nuevo México 25% 50% 5% 15% 5%
NYCPS 50% 50%
Tennessee 45% 35% 15% 5%
Promedio 37% 33% 32% 8% 11% 8%
Fuente: Elaboración propia basada en información de Wyckoff y Katz (2018).
Nota: El nivel de profesionalismo del docente se mide en aspectos como su puntualidad, el cumplimiento de sus responsa-
bilidades, el trabajo en equipo e incluso el cuidado de su apariencia.
es el instrumento más comúnmente utilizado sino además el que más peso tiene en las cali-
ficaciones finales de las evaluaciones en esa nación. Dado esto, cobra aún más relevancia la
discusión anterior en torno a la necesidad de contar con un diseño y una implementación
cuidadosos de dicho instrumento, de modo de asegurarse que este logre dar información
certera, válida y consistente de las prácticas pedagógicas de los docentes.
Como se detalló en el capítulo anterior, el estudio de MET (2013) sugiere que aque-
llos instrumentos basados en los resultados de pruebas estandarizadas de conocimientos
de los alumnos deben incluirse en las evaluaciones y recibir un tercio del peso en la califi-
cación final cuando sea posible complementarlos con observaciones en clase y encuestas
estudiantiles. Esta ponderación permite no solo obtener correlaciones altas con resultados
posteriores de los alumnos en distintas pruebas de conocimiento estandarizadas, sino que
además es la que otorga la mayor confianza de todas. A pesar de que, como se observó,
la mayoría de los estados y distritos de Estados Unidos efectivamente incluyen este instru-
mento en sus evaluaciones, el peso que se les asigna no es alto. En promedio, Steinberg y
Donaldson (2016) encuentran que en dicho país las medidas de valor agregado y de creci-
miento en percentiles tienen un peso del 16% y del 10% dentro de los sistemas de evaluación
respectivamente (cuadro A1 del apéndice). En los seis casos de Estados Unidos que se deta-
llan en este capítulo, este promedio sube al 37%. Este incremento se explica por el estado
de Nuevo México, que a los instrumentos basados en los resultados de pruebas estandari-
zadas de conocimientos de los alumnos les concede un 50% del peso en sus evaluaciones,
y por Tennessee y DCPS, que les otorgan un 35% del puntaje final. Por el contrario, Denver
tan solo asigna el 10% del puntaje final a estas medidas de desempeño estudiantil.
De hecho, al comparar el peso asignado a los distintos instrumentos en los seis
casos examinados para Estados Unidos, resalta el hecho de que el instrumento con el
segundo mayor peso es aquel relacionado con el análisis del cumplimiento de las metas
42 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
de aprendizaje que ha fijado el docente al comienzo del año. Por ejemplo, New Haven y
la ciudad de Nueva York le asignan el 50% de la calificación final a este instrumento y, de
los seis casos considerados, tan solo Nuevo México no lo incluye dentro de la evaluación
docente. La preponderancia concedida a este instrumento iría en contra de las recomen-
daciones de expertos en el tema, ya que, por su diseño e implementación, es una medida
mucho más subjetiva y difícilmente estandarizable. Sin embargo, cabe aclarar que estos
seis casos parecerían atípicos en relación con lo que ocurre en Estados Unidos, ya que,
como se observa en el cuadro A1 del apéndice, el promedio a nivel nacional en cuanto al
peso que se le asigna a este instrumento baja al 10%.
El último aspecto que deben decidir las autoridades educativas en torno al puntaje
dentro de la evaluación docente es el tipo de calificación que se le asignará a cada docente
y las consecuencias que de allí se derivan. Con respecto al primer aspecto, de acuerdo con
el estudio de Kraft y Gilmour (2017), la mayoría de los estados optó por tener una califica-
ción con cuatro categorías: Muy Efectivo, Efectivo, En Desarrollo y No efectivo. De hecho,
únicamente tres de los 24 estados considerados en el mencionado estudio incluyeron una
quinta categoría de “Excepcional”. Sin embargo, a pesar de los avances en la utilización
de múltiples instrumentos para la evaluación docente, acordes con la labor compleja y las
múltiples dimensiones que buscan analizar, y los esfuerzos en tiempo y dinero que esto
ha traído consigo, la calificación final otorgada a los docentes en Estados Unidos sigue
concentrada en la cola superior de la distribución. En la mayoría de los estados analiza-
dos menos del 10% de los docentes fue clasificado en las últimas dos categorías (véase el
gráfico A2 del apéndice).7 Tal como lo mencionan Wyckoff y Katz (2018), esta concentra-
ción en la cola superior no es consistente con otras medidas de la calidad educativa, como
—por ejemplo— los resultados que obtienen los estudiantes en pruebas estandarizadas. De
acuerdo con los autores, sería de esperar que las calificaciones de los docentes siguieran
en parte la distribución de los alumnos. Las diferencias entre ambos llevan a concluir que,
aunque sin duda hay una mejoría en los sistemas de evaluación actuales al compararlos
con los que existían antes, son necesarios mayores esfuerzos para continuar mejorándolos.
Como quedó claro en la teoría del cambio (gráfico 2.1), el uso que se les dé a los resulta-
dos obtenidos en las evaluaciones docentes es fundamental para lograr mejoras efectivas
7 La revisión de CUREE (2018) no detalla estos aspectos y solo menciona como es la clasificación final
otorgada para tres países en su análisis. En Ontario únicamente existen dos categorías (satisfactorio
y no satisfactorio); en Singapur el sistema otorga un puntaje numérico de 1 a 100 y en base a este los
docentes son clasificados con un desempeño de excelente a pobre; en República de Corea los docentes
son catalogados en una de cinco categorías que van de la A (la mayor) a la E (la menor). No hay infor-
mación con respecto a la distribución de la calificación final obtenida por los docentes para ninguno de
los sistemas educativos analizados por los autores.
CÓMO SE EVALÚA A LOS DOCENTES EN LOS SISTEMAS EDUCATIVOS EXITOSOS 43
CUADRO 3.3 | C
onsecuencias ligadas a los resultados de la evaluación docente en
los sistemas educativos exitosos seleccionados
Bonificaciones/
País Diagnóstica salarios Ascenso Formación Permanencia
Ontario (Canadá)
Reino Unido
Nueva Zelanda
Singapur
Rep. de Corea
Estonia
Denver
DCPS
New Haven
Nuevo México
NYCPS
Tennessee
Uso promedio 17% 75% 67% 25% 25%
Fuente: Elaboración propia basada en información de Wyckoff y Katz (2018) y CUREE (2018).
8 Como lo detallan Wyckoff y Katz (2018), algunos de los sistemas analizados cuentan con planes o
programas que buscan apoyar el desarrollo profesional de los docentes. Sin embargo, estos no están
necesariamente ligados a los sistemas de evaluaciones docentes. Por ejemplo, Tennessee llevó a cabo
un programa piloto de un modelo de colaboración entre pares en la escuela; a partir de datos de obser-
vación en el aula, los docentes de bajo rendimiento se asociaron con docentes de alto rendimiento con
el objetivo de que trabajaran juntos durante el año escolar 2013–14. Una evaluación de impacto del men-
cionado piloto sugiere que la estrategia aumentó los logros estudiantiles (Papay et al., 2016) y es posible
que el estado decida ampliar el programa. DCPS también cuenta con un programa conocido como
CÓMO SE EVALÚA A LOS DOCENTES EN LOS SISTEMAS EDUCATIVOS EXITOSOS 45
analizados por Steinberg y Donaldson (2016), y que se resumen en el cuadro A2 del apén-
dice, saltan a la vista diferencias notables. De hecho, el desarrollo profesional es el aspecto
más comúnmente ligado a los resultados de las evaluaciones de desempeño según estos
investigadores. Le sigue como consecuencia más común la terminación de los contratos
para aquellos docentes que muestren un bajo desempeño, y finalmente, en menos de la
mitad de los sistemas analizados los resultados se atan a ascensos o bonificaciones (la
única excepción es para los “estados de origen”, home states, en donde en el 75% de los
casos analizados sí se vinculan los resultados de las evaluaciones docentes con aspectos
de progresión en la carrera).
Del análisis de las principales características de los sistemas de evaluación docente
en los 12 sistemas educativos aquí considerados, se desprenden varias conclusiones clave.
La primera es que, aunque no existe un único diseño ideal, la gran mayoría de los sis-
temas se ha movido hacia el uso de evaluaciones que cuentan con una multiplicidad de
instrumentos orientados a entender las dimensiones del desempeño docente que los paí-
ses consideran importantes.
En segundo lugar, aunque todos incluyen la observación en clase como herramienta
central en los procesos de evaluación, su diseño e implementación varía de manera con-
siderable. Como lo han demostrado las investigaciones alrededor del tema, esto genera
impactos en la validez y confiabilidad de los instrumentos. Por lo tanto, asegurar la
implementación llevada a cabo en sistemas como el de New Haven, donde se utilizan
observadores externos entrenados que realizan al menos dos observaciones por docente,
son ejemplos deseables, pero sin duda costosos.
En tercer lugar, el uso de instrumentos basados en resultados obtenidos por los pro-
pios estudiantes en exámenes estandarizados parece ser una herramienta mucho más
común en los sistemas educativos de Estados Unidos que en el resto de los países estudia-
dos. La explicación de este fenómeno puede explicarse en parte por el financiamiento que
el gobierno federal de ese país ha dado a sus sistemas educativos recientemente para la
implementación de dichos exámenes en múltiples grados y materias. La evidencia sugiere
que este tipo de herramientas quizá sea el que mayor validez posee para identificar la
efectividad de los docentes en el conocimiento disciplinar adquirido por los estudiantes,
medido por estas pruebas específicas, pero queda claro que requiere inversiones iniciales
importantes que hoy en día no existen en los países de América Latina y el Caribe y que
dejarían a la mayor parte de los docentes sin información en este aspecto.
Por último, el uso de los resultados que surgen de las evaluaciones es fundamental.
Curiosamente, los casos analizados en este capítulo sugieren que la mayoría de los sistemas
LEAP, dirigido a reforzar las habilidades de los docentes a través de grupos pequeños donde se discuten
aspectos relacionados con la planificación, las estrategias de enseñanza, los avances de los estudiantes
e incluso temas disciplinares. Sin embargo, ninguno de estos programas, por ahora, está atado directa-
mente a los sistemas de evaluación docente.
46 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
ata a un mismo tipo de evaluación tanto las consecuencias formativas como aquellas rela-
cionadas con incentivos monetarios y de carrera. Esto contrasta de manera notable con
algunos casos de América Latina donde los sistemas han evolucionado hacia la implemen-
tación de distintos tipos de evaluaciones para alcanzar diferentes propósitos, que es lo que
sucede en República de Corea.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 47
CAPÍTULO 4
1 La información presentada se nutre también del documento de antecedentes producido por Rodríguez
y Rivera (2018).
2 La información se recopiló durante 2017, y presenta actualizaciones a 2019 en la medida de lo posible.
47
48 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
iii) evaluaciones para docentes en ejercicio. Mientras en las primeras dos etapas solo existe
un tipo de evaluación específica, en la tercera etapa se consideran dos evaluaciones dife-
rentes con características particulares: evaluaciones obligatorias periódicas y evaluaciones
para ascensos o bonificaciones. Para cada tipo de evaluación, se revisa si existe mención en
los estatutos, investiga si efectivamente se implementa, compara los instrumentos utiliza-
dos y cómo los resultados obtenidos están atados o no a procesos de formación continua
y si determinan implicaciones a lo largo de la carrera docente.
Debido a que las evaluaciones se aplican en distintas etapas de la carrera, sus objetivos,
su diseño y su implementación tienen aspectos particulares y varían incluso dentro de un
mismo país. La primera evaluación analizada, que se realiza en la gran mayoría de los siste-
mas educativos de la región que integran este estudio excepto en Belice y Jamaica, define si
un individuo puede entrar o no en la fuerza docente del sistema público. En algunos países
este tipo de evaluación se conoce como “concurso docente”. La segunda evaluación, que es
la menos común de todas en los sistemas analizados, determina si docentes principiantes
que ingresaron en el magisterio tienen las habilidades pedagógicas y disciplinares requeri-
das para asegurar el aprendizaje de sus estudiantes y, por lo tanto, para permanecer en el
sistema y en la carrera docente. Finalmente, en la última etapa se analizan dos tipos de eva-
luaciones que se administran a docentes que superaron el período de prueba con éxito, han
sido nombrados en un cargo docente y por tanto se encuentran regidos por los estatutos
docentes de cada país. Las primeras (a las que en este estudio se denomina evaluaciones
obligatorias periódicas) se aplican a docentes de manera obligatoria en períodos estable-
cidos. De acuerdo con los estatutos docentes, en la mayoría de los casos los resultados de
estas evaluaciones determinan la permanencia o estabilidad laboral y, en ocasiones, también
las capacitaciones que los docentes deberían recibir para subsanar falencias. Las segundas
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 49
(a las que en este estudio se denomina evaluaciones para ascensos horizontales) se imple-
mentan para establecer si el docente puede avanzar o no en su carrera profesional.
La sistematización permite extraer conclusiones importantes de cada uno de los cua-
tro tipos de evaluaciones analizados en el presente estudio. Respecto de las evaluaciones de
ingreso a la carrera, la legislación de 17 de los sistemas educativos incluidos en este trabajo las
menciona de manera explícita y las hace obligatorias para la entrada al magisterio. No obs-
tante, se encontró que en cinco de estos sistemas las evaluaciones no se realizan. En estos
casos, podrían ocurrir tres situaciones: i) la selección se basa únicamente en la verificación de
títulos académicos, ii) el proceso puede ser corrupto, iii) no existe información que compruebe
de forma efectiva si las evaluaciones se están llevando a cabo y en qué condiciones (FEREMA,
2015). En la gran mayoría de los 12 sistemas restantes, la selección se basa en la evaluación del
conocimiento disciplinar y pedagógico de los aspirantes a través de la presentación de exáme-
nes como principal instrumento. En casi la mitad de ellos, los exámenes se complementan con
entrevistas. Sin embargo, no es posible conocer su estructura y su nivel de profundidad.
Las falencias en la calidad de la formación inicial y las características de los interesados
en ingresar a la profesión docente en la región (reseñadas por Elacqua et al., 2018), suma-
das a la dificultad que tienen los ministerios de educación para remover del cargo a docentes
con bajos niveles de desempeño, convierten a las evaluaciones de ingreso a la carrera en
un elemento esencial para identificar mejor las características y capacidades de los futu-
ros docentes. En ese sentido, continuar con los procesos de mejora y de implementación
adecuada de esta evaluación podría traer beneficios en la calidad de la fuerza docente en
la región. Aunque la evidencia aún es escasa, estudios para Colombia (Ome, 2012; Brutti y
Sánchez, 2017) y México (Estrada, 2019) sugieren que estos sistemas de selección (con eva-
luaciones para ingresar a la carrera) están teniendo algunos impactos positivos en la calidad
educativa de los países que los implementan. Asimismo, las investigaciones disponibles indi-
can que el nivel de motivación también es fundamental para un desempeño adecuado en el
sector público (Banuri, Keefer y De Walque, 2018), y la docencia no debe ser la excepción. Por
eso, los procesos de selección de docentes para la carrera magisterial deberían tener tam-
bién en consideración este aspecto para atraer a candidatos motivados (Elacqua et al., 2018).
De manera similar, los primeros años de ejercicio en la carrera docente tienen un papel
sustancial en el desarrollo de las capacidades de los docentes (Jensen et al., 2012; Ávalos,
2016). Actualmente, la mayoría de los sistemas analizados contempla en la legislación algún
tipo de programa de inducción docente y lo implementa. Aunque la calidad de los progra-
mas no resulta clara, su existencia es, en sí misma, un paso importante. Hay evidencia de que
la correcta inserción de los docentes noveles y el apoyo a los recién ingresados en la carrera
están en la discusión política en un poco más de la mitad de los países de la región.3 Aun así,
3 El diseño, la implementación y los impactos de estos programas se encuentran fuera del alcance de este
estudio. Los lectores pueden acceder a información destacada en documentos como Ávalos (2016) y
Marcelo y Vaillant (2017), entre otros.
50 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
4 Como se detalla en la sección respectiva, la única excepción a esta tendencia se da en Paraguay, país
que en 2017 introdujo una evaluación con múltiples instrumentos. Como el sistema aún se encuentra en
la fase inicial y se espera que su implementación sea gradual, es posible que la periodicidad deba modi-
ficarse en un futuro para que su aplicación sea viable.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 51
efectivos del magisterio es casi inexistente. Quizás, el mayor uso que se les da a los resul-
tados que surgen de las evaluaciones tiene que ver con los ascensos en el escalafón, que
debido a la estructura de las evaluaciones terminan dependiendo más de los años de expe-
riencia y de los títulos que de las destrezas y habilidades docentes.
En los sistemas educativos que reglamentan evaluaciones obligatorias con una perio-
dicidad mayor la situación es distinta. En primer lugar, en la totalidad de estos sistemas las
evaluaciones efectivamente se implementan, aunque no en todos los casos se efectúan
tal como lo establece la legislación. En segundo término, por lo general los sistemas inclu-
yen múltiples instrumentos en busca de evaluar de manera efectiva el desempeño de sus
docentes. Aunque la elección final de instrumentos es variada, la observación en clase y la
presentación de exámenes estandarizados son los más utilizados y los que mayor peso han
recibido dentro de la evaluación por parte de las autoridades educativas. En tercer lugar,
la gran mayoría de los sistemas contempla el uso de evaluadores externos a la institución
educativa para la implementación de las evaluaciones. En varios de ellos, incluso, existen
instituciones dedicadas a esta labor, lo cual le otorga al sistema una independencia mayor
que la que tiene cuando la evaluación la realiza solo el director. Por último, aunque en la
mayoría de estos sistemas la legislación ata los resultados de las evaluaciones a decisiones
de permanencia y/o de programas de formación en servicio, los sistemas no han logrado
aún implementar esto de manera profunda. Por lo que se ha observado en el marco de esta
revisión, se producen pocos despidos efectivos de docentes del magisterio como conse-
cuencia de esto, al igual que en los sistemas con evaluación obligatoria anual. Por otro lado,
a pesar de que Chile, México y Perú atan los resultados a este tipo de programas solo se
están aplicando de manera efectiva en el primer país.
El último tipo de evaluación analizada es la que los sistemas implementan para permi-
tir los ascensos en la carrera docente. En particular, el capítulo estudia las posibilidades y
los requisitos que exige la legislación para ascender en la carrera y acceder a mayores nive-
les de ingreso, prestigio y, quizás, responsabilidades, sin la necesidad de dejar las aulas para
ocupar cargos más administrativos. Estos ascensos, que como se explicó anteriormente
se denominan ascensos horizontales, son distintos de aquellos en los que los docentes
ascienden a cargos administrativos como directores o coordinadores, que se llaman ascen-
sos verticales. La revisión permitió dividir los sistemas educativos en tres grupos claros de
acuerdo con las posibilidades y los requisitos de ascensos horizontales: i) sistemas donde
no existe este tipo de ascensos, ii) sistemas donde existe la posibilidad de ascender hori-
zontalmente pero estos ascensos dependen de forma exclusiva de los años de experiencia
y/o los títulos académicos y iii) sistemas en los cuales los ascensos horizontales son merito-
cráticos y es preciso superar pruebas específicas para alcanzarlos. En cuanto a este último
grupo es importante resaltar tres puntos. En primer lugar, el tipo de evaluación al que están
sujetos los ascensos horizontales y las características asociadas, tales como la periodicidad,
los instrumentos y los responsables, varían de manera significativa entre sistemas. En según
término, la revisión encontró que en algunos sistemas los docentes no deben presentar
52 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
una evaluación adicional a la obligatoria, sino que los puntajes obtenidos en la evaluación
obligatoria son tenidos en cuenta en las decisiones de ascensos horizontales. En general,
los sistemas que llevan a cabo evaluaciones obligatorias con una multiplicidad de instru-
mentos aprovechan la información brindada por estas pruebas como insumo esencial al
momento de tomar decisiones de ascenso. En otros sistemas, aunque la reglamentación es
clara respecto del requisito de una evaluación específica de ascensos horizontales, no existe
evidencia que permita verificar que efectivamente lo escrito en la ley está siendo aplicado.
Por último, como se ha observado en otras evaluaciones, existen diferencias importantes
entre sistemas con relación al nivel de implementación de los requisitos e, incluso, dentro del
mismo sistema la situación de facto se opone en ocasiones a la de jure.
A continuación se presenta el análisis de dos cuestiones que están muy ligadas a la
evaluación docente y a la carrera en general: i) la existencia de estándares de desempeño
docente que guíen no solo la estructura de las evaluaciones docentes implementadas sino
también temas trascendentales como la formación inicial, la formación en servicio y las
propias expectativas de la fuerza docente en el país; ii) la reglamentación de la carrera
docente, sobre todo en lo relacionado con la evaluación docente y la manera en que esta
determina, o no, las posibilidades de permanencia, capacitación, bonificaciones y ascensos
en cada sistema educativo. En varios de los sistemas educativos analizados, las evaluacio-
nes docentes se aplican en el marco de leyes de carrera docente recientes, que buscan
hacer la carrera más meritocrática y elevar el prestigio de la profesión. Las nuevas carre-
ras les permiten a los docentes acceder a mayores salarios y a mejores oportunidades de
crecimiento profesional. Luego, el capítulo continúa con toda la información recolectada
y estudiada sobre evaluación docente y la descripción detallada de aspectos esenciales,
también relevados para la revisión de las experiencias por fuera de la región, como los ins-
trumentos utilizados, los pesos asignados, las consecuencias que emanan de los resultados
y los actores involucrados en las distintas etapas, entre otras características que la litera-
tura especializada en el tema considera fundamentales.
Finalmente, aunque no es un tema que se analice en detalle en este libro, es impor-
tante resaltar que, en la mayoría de los países de la región, la implementación inicial de
las nuevas evaluaciones fue rechazada por los sindicatos de maestros, por lo que nume-
rosos gobiernos debieron sortear (y en algunos casos siguen sorteando) paros nacionales
importantes de la fuerza docente en oposición a la aplicación de evaluaciones. Para reducir
dicha resistencia, los gobiernos han utilizado una variedad de estrategias, como, por ejem-
plo, atar los resultados únicamente a consecuencias positivas para los docentes, publicar
los bajos resultados de aprendizaje de los alumnos para dar un mayor sentido de urgencia
a la implementación de reformas, movilizar el apoyo de la opinión pública a los procesos
de evaluación, y, en algunos casos, establecer penalidades para los docentes que no parti-
cipen en las evaluaciones, entre otras. El manejo político que hace falta para llevar a cabo
estas evaluaciones al igual que el gran número de docentes del sector público que hay en
muchos países de la región han provocado que la implementación se esté realizando de
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 53
forma gradual (Elacqua et al., 2018). Algunos estudios que han investigado aspectos vincu-
lados con los acuerdos y la implementación final de programas y políticas docentes en la
región incluyen los de Mizala y Schneider (2014 y 2019), en los que los autores analizan la
economía política alrededor de las reformas realizadas en el sistema de evaluación docente
y la reglamentación de la carrera docente en Chile, respectivamente. Por su parte, Bruns,
De Gregorio y Taut (2016) estudian el tema de manera general con un énfasis en particular
para la región latinoamericana.
A pesar de las dificultades y aunque todavía es necesario realizar más acciones en este
eje de la profesión, los avances alcanzados en varios países de la región en cuanto a la eva-
luación docente han sido positivos, tal como se describe a continuación.
GRÁFICO 4.2 | A
vance de los estándares de desempeño docente en América Latina
y el Caribe
MÉXICO REPÚBLICA
DOMINICANA
JAMAICA
BELICE
HONDURAS
GUATEMALA
EL SALVADOR TRINIDAD Y TOBAGO
PANAMÁ
COSTA RICA
COLOMBIA
ECUADOR
PERÚ
BRASIL
BOLIVIA
PARAGUAY
CHILE
URUGUAY
ARGENTINA
han sido discutidos y aprobados por diversos sectores de la sociedad, como ministerios,
docentes y en algunos casos organizaciones no gubernamentales del sector educativo, y
guían el diseño y la aplicación de la política pública docente. En la actualidad, Guatemala y
Panamá están en proceso de elaboración de los estándares; mientras que Colombia, Hon-
duras, Jamaica y Paraguay incorporaron ciertos estándares específicos para sus procesos
de evaluación docente desarrollados recientemente. Los demás sistemas educativos no
cuentan con estándares de desempeño docente. Algunos, como Bolivia y El Salvador, han
definido perfiles de egreso de las carreras de formación docente y otros tienen estatutos
docentes que describen de manera general las obligaciones mínimas que deben cumplir
los docentes que se encuentran regidos por ellos.
Dentro del grupo de países que han llevado a cabo el proceso de discusión, diseño, apro-
bación e implementación de estándares docentes en la región, Chile es el pionero. Este país
creó en 2003 el Marco para la Buena Enseñanza, basado en cuatro dominios: la preparación
para la enseñanza, la creación de un ambiente propicio en clase, la enseñanza para el apren-
dizaje de todos los estudiantes y las responsabilidades profesionales. Desde su creación, el
Marco ha orientado las políticas de fortalecimiento de la profesión docente, ha sentado las
bases para el diseño de programas de formación inicial y en ejercicio y ha sido utilizado en
los procesos de evaluación del desempeño. Más importante aún es que ha permitido que los
docentes del país tengan una guía para reflexionar y evaluar sus propias prácticas de ense-
ñanza y educación. De hecho, entre 2016 y 2017 se realizó una consulta para actualizarlo
sobre la base de nuevas discusiones y procesos participativos con la academia y los propios
docentes. La propuesta fue presentada al Consejo Nacional de Educación, ente que deberá
revisarlo y aprobarlo antes de que entre en vigor la nueva versión.
En los demás países que integran este grupo los estándares de desempeño son más
recientes y, por tanto, su utilización ha sido menor. Sin embargo, en ellos también se lleva-
ron a cabo procesos reflexivos que permitieron establecer con claridad lo que se espera de
la labor docente. En el caso de Ecuador, los estándares de 2012 constan de cuatro dimen-
siones referentes al dominio disciplinar y curricular, la gestión del aprendizaje, el desarrollo
profesional y el compromiso ético. Además, cada una de estas cuatro dimensiones tiene
estándares generales, estándares específicos e indicadores. Por su parte, en México los
estándares definen que un buen docente debe: i) conocer a sus alumnos; ii) organizar,
evaluar su trabajo y hacer una intervención didáctica; iii) mejorar continuamente su for-
mación y sus prácticas pedagógicas; iv) asumir sus responsabilidades legales y éticas, y
v) participar de manera activa en la escuela y en la comunidad. En Perú, el Marco de Buen
Desempeño Docente aprobado en 2012 contempla cuatro dominios que incluyen la pre-
paración para el aprendizaje de los estudiantes, la enseñanza para el aprendizaje de los
estudiantes, la participación en la gestión de la escuela articulada a la comunidad y el desa-
rrollo de la profesionalidad y la identidad docente. Finalmente, los estándares de República
Dominicana aprobados en 2014 también comprenden cuatro dimensiones: i) el reconoci-
miento del estudiante y sus individualidades como centro de atención, ii) el conocimiento
56 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
Fuente: Elaboración propia sobre la base de los estatutos docentes de cada país.
5 En la actualidad, cerca del 50% de los docentes se rige por el antiguo estatuto, el 30% lo hace por el
nuevo estatuto y el porcentaje restante corresponde a docentes provisionales.
58 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
remuneraciones de los docentes. Todos estos cambios, que buscaban aumentar el prestigio y
la calidad de la docencia en el país, modernizaron la carrera y contemplaron aspectos de rendi-
ción de cuentas que antes no existían. De igual forma, en Honduras la reglamentación de la Ley
Fundamental de Educación (2012) aprobada durante 2014 incorporó cambios importantes en
la legislación vinculada con la fuerza docente que comprenden el Reglamento de la Formación
Inicial de Docentes, el Reglamento de Formación Permanente de Docentes, el Reglamento de
Evaluación Docente y el nuevo Reglamento de la Carrera Docente. Aunque estos nuevos instru-
mentos todavía no se aplican en el país, que la legislación los contemple es sin dudas un avance.
Perú, por su parte, aprobó en 2012 la Ley de Reforma Magisterial (Ley Nº 29944), que
modifica las normas de selección de los docentes, su progresión dentro de la carrera y
su desarrollo como profesores. La idea fundamental de la nueva reglamentación es que
la carrera debe estar regida por la excelencia y el principio de mérito y capacidad. Esto
implica que el país está llevando a cabo esfuerzos importantes para establecer un proceso
de evaluación capaz de garantizar que ingresen en la profesión y permanezcan en ella los
docentes más idóneos, fortalecer los programas de formación y capacitación permanente
y mejorar los salarios del gremio.
También para México 2012 fue un punto de inflexión en torno de las políticas docen-
tes. Aunque el país había efectuado reformas importantes previas, como la introducción
del Programa de Carrera Magisterial en 1993, solo a partir de 2012 se puso en marcha una
reforma del sistema educativo en diversas áreas. En ese sentido, es importante resaltar
la creación del Instituto Nacional para la Evaluación de la Educación (INEE), un ente que
estaba encargado de regular y supervisar las evaluaciones docentes en el país, y la Ley
General del Servicio Profesional Docente, que regulaba un nuevo tipo de carrera merito-
crática para los docentes. Sin embargo, estas reformas fueron derogadas en 2019 (en la
práctica eliminando a el INEE y la evaluación docente).
Finalmente, vale destacar el caso de Chile, el país donde más recientemente se han lle-
vado a cabo reformas en la reglamentación de la carrera docente. Si bien el primer estatuto
data de 1993, en 2016 se establece la Ley N° 20903 que crea el Sistema Nacional de Desarrollo
Profesional Docente (SNDPD). El nuevo sistema tiene como objetivo aumentar la valoración
de la carrera por medio de una formación inicial de la más alta calidad, asegurar una inser-
ción a la carrera a través de un acompañamiento en los primeros años de ejercicio, elevar
la formación continua y una mejora en la remuneración docente de acuerdo con el nivel de
desarrollo profesional. Así, la Ley del SNDPD, la Ley de Evaluación Docente de 2004 y la ley
20.501 sobre calidad y equidad de la educación de 2011 promueven una carrera meritocrá-
tica para todos los docentes que trabajan en escuelas públicas o subvencionadas en el país.
Las diferencias en los estatutos que definen las reglas que rigen la profesión docente
en la región son inmensas. Sin embargo, debido al interés particular de este estudio, se
resaltan dos aspectos cruciales relacionados con las evaluaciones docentes. El primero de
ellos está ligado al tipo y al número de evaluaciones docentes consignados en cada esta-
tuto y a los cuales, por lo tanto, están sujetos los docentes. El segundo aspecto, que se
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 59
analiza en detalle más adelante, tiene que ver con la clase de carrera que determina cada
uno de ellos y las posibilidades de ascensos que cada docente tiene.
El análisis de los estatutos permite evidenciar que, salvo contadas excepciones, los sis-
temas que realizaron reformas recientes han definido carreras más meritocráticas y menos
burocráticas que las que existen en sistemas con estatutos que no han sido modificados
en más de 30 años. Por otra parte, en los sistemas mencionados en primer lugar la eva-
luación docente es más completa en términos de diseño (en cuanto a la multiplicidad de
instrumentos y a los evaluadores utilizados) e implementación (entendida como la apli-
cación efectiva de lo establecido en las leyes) y en el uso que se da a los resultados de
las evaluaciones cuando efectivamente se hacen. Los detalles de cada tipo de evaluación
se presentan en las secciones correspondientes. No obstante, el cuadro 4.1 indica si los
CUADRO 4.1 | E
valuaciones mencionadas de manera explícita en los estatutos de
cada sistema educativo
Tipo de evaluación docente
Concurso Período Obligatoria Ascensos
Sistema educativo docente de prueba periódica horizontales
Prov. Buenos Aires (Argentina)
Belice
Bolivia
Santa Catarina (Brasil)
Chile
Colombia
Costa Rica
Ecuador
El Salvador
Guatemala
Honduras
Jamaica
México
Panamá
Paraguay
Perú
República Dominicana
Trinidad y Tobago
Uruguay
Se menciona explícitamente en los estatutos de cada país
En estos países se otorga una licencia en lugar de concurso
No existe mención alguna al respecto en los estatutos
Fuente: Elaboración propia sobre la base de Rodríguez y Rivera (2018).
60 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
estatutos se refieren de manera explícita a cada una de las cuatro evaluaciones analiza-
das en este estudio: concursos para entrar a la carrera docente, evaluación de período de
prueba, evaluaciones obligatorias periódicas y evaluaciones que definen ascensos hori-
zontales en la carrera. Es decir, establece la situación de jure respecto de cada tipo de
evaluación para cada sistema educativo.
Al observar el cuadro 4.1 se pueden extraer, al menos, cuatro mensajes claros. El pri-
mero es que, sin duda, los países de la región han incluido en la agenda de política docente
la discusión acerca de la evaluación en distintas etapas de la carrera y su obligatoriedad.
El segundo mensaje es que estos esfuerzos se han concentrado en dos evaluaciones: eva-
luaciones para el ingreso a la carrera y evaluaciones obligatorias periódicas. Hoy en día la
totalidad de los sistemas educativos analizados obliga a que al menos una parte de sus
docentes cumpla con requisitos mínimos y presente una evaluación para poder ingresar
a la carrera. Asimismo, con excepción de los sistemas de Belice y Santa Catarina (Brasil),
todos buscan llevar a cabo procesos de evaluación obligatoria periódica de sus docentes.
En tercer lugar, a través de evaluaciones que determinan los ascensos horizontales, se ha
buscado permitirle al docente ascender en su carrera en términos de prestigio, recursos
económicos y responsabilidades sin necesidad de abandonar el aula de clase. Aunque esta
posibilidad y los requisitos meritocráticos relacionados con ella son menos comunes, la evi-
dencia sugiere que es un aspecto que está en la mira de algunas autoridades educativas de
la región. Por último, quizás el aspecto en el que menor esfuerzo han hecho los países en
términos de evaluación docente es el de las evaluaciones tras un período de prueba.
La simple mención de las evaluaciones y de su obligatoriedad es un avance importante
y sienta las bases legales para su implementación. Sin embargo, la efectiva aplicación y la
calidad de estas varían de forma notable en la región. Las siguientes secciones detallan las
principales características en cada una de estas cuatro evaluaciones.
Tal como describen Elacqua et al. (2018), durante el siglo XX los países latinoamericanos
hicieron esfuerzos inmensos por asegurar una mayor cobertura educativa. Por supuesto,
para dar respuesta al creciente número de alumnos que entraban al sistema era necesario
incrementar también de modo veloz el número de docentes públicos contratados por los
gobiernos. Como consecuencia de esto, la mayoría de los países flexibilizó los requisitos de
entrada al magisterio y expandió los programas de formación docente sin tener en cuenta
criterios de calidad. Estas dos decisiones, unidas a una caída en el salario relativo promedio
de los docentes y la apertura de nuevas oportunidades laborales para las mujeres, explican
en gran medida el deterioro del prestigio de la profesión en la región.
Como consecuencia directa de esto, la preparación promedio de los que actualmente
ejercen la docencia ha disminuido de forma significativa y el número de estudiantes que
esperan entrar en el futuro cercano en la profesión ha caído de un modo notable. La baja
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 61
calidad disciplinar promedio que existe hoy entre los docentes se observa en los resultados
de la prueba TEDS-M, que evaluó los conocimientos de matemáticas de docentes de 17 paí-
ses, entre ellos Chile, y en la cual los docentes chilenos ocuparon el último lugar. En tanto,
evidencia para países como Belice (Näslund-Hadley, Alonzo y Martin, 2013), Costa Rica
(OCDE, 2017) y República Dominicana (Caraballo et al., 2014) sugiere que los docentes ni
siquiera dominan el contenido disciplinar de lo que enseñan. De manera similar, en pruebas
estandarizadas realizadas en Colombia, estudiantes de pedagogía obtienen puntajes infe-
riores a los del conjunto de próximos graduados de educación superior en el país (Figueroa
et al., 2018). Con respecto a las habilidades de los jóvenes que se encuentran próximos a
graduarse en la educación secundaria y están interesados en la carrera docente la informa-
ción existente tampoco es alentadora. Los resultados de las pruebas PISA (Elacqua et al.,
2018) y de pruebas nacionales estandarizadas de Chile y Colombia (Alvarado et al., 2012, y
García et al., 2014) indican que el nivel de habilidades de jóvenes interesados en la docen-
cia está por debajo del que muestran los interesados en carreras como las ingenierías, las
ciencias, la medicina o el derecho.
En estas condiciones, los criterios de selección de los candidatos que finalmente son
contratados por los gobiernos latinoamericanos para ejercer la profesión docente resultan
fundamentales. Solo escogiendo a los individuos mejor preparados y más motivados para
esta labor podrá mejorar la calidad de la educación brindada en la región.
La revisión de este aspecto en los 19 sistemas educativos analizados indica que en
la actualidad todos ellos cuentan con algún tipo de proceso de selección de candida-
tos (véase el cuadro 4.1). En dos de ellos, Belice y Jamaica, el Estado otorga una licencia
renovable necesaria para poder ejercer la profesión.6 En los 17 sistemas restantes la regla-
mentación vigente obliga a que la mayoría de los candidatos deba participar y aprobar
algún tipo de concurso de oposición o de méritos para poder entrar al magisterio. Vale la
pena mencionar que hay mucha heterogeneidad en el tipo de concurso, los instrumentos
utilizados y el nivel de implementación.
El gráfico 4.4 resume cuatro características básicas de los concursos docentes exis-
tentes en los sistemas educativos incluidos en el estudio (los detalles de cada una de estas
6 Toda persona interesada en enseñar en una institución educativa en Belice debe cumplir requerimien-
tos específicos para solicitar al “Chief Education Officer” una licencia que le permita ejercer. Desde un
tiempo atrás, el país está en una discusión avanzada que busca homogeneizar y estandarizar los requi-
sitos de ingreso a la carrera docente dentro del magisterio. Se esperaba que en 2018 se introdujera un
examen nacional de ingreso que permitiera identificar realmente qué candidatos tenían las calificacio-
nes y la preparación necesarias para llevar a cabo la labor docente en el país. Aunque el país llevó a cabo
la primera de estas evaluaciones, sus resultados, sus posibles modificaciones y su aplicación definitiva
todavía están en discusión. Por su parte, en Jamaica toda persona graduada de una carrera docente
acreditada por el gobierno debe registrarse ante el Ministerio de Educación para quedar certificada
como una persona académicamente preparada para ejercer la carrera docente. Una vez cumplido este
proceso, la persona obtiene el registro que establece que es un profesional preparado para ejercer la
profesión y tiene el permiso del gobierno para poder ejercer como docente en el país.
62 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
60%
84%
89%
40% 79%
20% 42%
16%
0%
Concurso de Concurso de ingreso Título profesional Título en pedagogía
ingreso obligatorio centralizado universitario es es un requisito
un requisito
Sí No
Fuente: Elaboración propia a partir de los datos de Rodríguez y Rivera (2018).
cuatro características para cada país se encuentran en el cuadro A3 del apéndice). Lo pri-
mero que vale la pena resaltar es que a pesar de que todos los estatutos mencionan de
manera explícita la necesidad de que el ingreso en la profesión se produzca a través de
concursos docentes (o licencias para el caso de Belice y Jamaica) en la realidad esto no
sucede. En algunos países, los concursos no se aplican a todos los docentes en el sistema,
lo cual deja espacio para una posible corrupción y la pérdida de una oportunidad para
seleccionar a los mejores candidatos. Específicamente, los concursos no son obligatorios
para todos los docentes en dos sistemas educativos: el de Bolivia y el de Guatemala. En
Bolivia, de acuerdo con el artículo 13 del Escalafón Nacional del Servicio de Educación,
los docentes normalistas —aquellos que estudian una carrera pedagógica— ingresan a la
carrera docente sin necesidad de realizar un examen o de aprobar un concurso de opo-
sición. El concurso es obligatorio para los docentes interinos, es decir para aquellos con
otro tipo de profesión en sus estudios de pregrado. En Guatemala, el concurso docente es
obligatorio para docentes interesados en enseñar en el nivel de preprimaria o primaria. Sin
embargo, los interesados en ser docentes de educación media no deben pasar por un con-
curso de oposición y son los directores quienes escogen a los docentes.
La segunda característica analizada es el nivel de centralización de los concursos
docentes. Como es posible observar en el gráfico 4.4, los concursos son un proceso cen-
tralizado en la gran mayoría de los países analizados: independientemente de la región o el
nivel educativo en los que quiera enseñar el candidato, todos los concursos están sujetos al
mismo proceso. A pesar de que en Belice y Jamaica el gobierno otorga licencias para ejer-
cer como docente y no hay un concurso como tal, fueron catalogados como países donde
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 63
el proceso es centralizado porque efectivamente solo una institución puede otorgar dichas
licencias en cada país y los requisitos son iguales para todos. Argentina y Brasil, en tanto
que tienen una organización gubernamental federal, cuentan con procesos descentraliza-
dos con características, instrumentos y exigencias que dependen de lo que establece cada
provincia, estado o municipio. De la misma forma, debido al nivel organizacional guberna-
mental que los caracteriza, Bolivia, Colombia, Costa Rica, Ecuador, El Salvador, Guatemala,
Honduras, Panamá, Paraguay, Perú, República Dominicana, Trinidad y Tobago y Uruguay
tienen procesos centralizados liderados por el ministerio de Educación de cada país. Cua-
tro países merecen una aclaración especial en cuanto a la centralización de los concursos.
El primero es Chile, porque en ese país la reglamentación de la carrera docente está cen-
tralizada de manera detallada en la Ley del Sistema Nacional de Desarrollo Profesional
Docente (SNDPD), pero el ingreso de nuevos docentes al sistema es descentralizado. Por el
contrario, en México, que tiene un sistema federal, el proceso de los concursos docentes se
puede catalogar como centralizado pues el Instituto Nacional para la Evaluación de la Edu-
cación (INEE) define los lineamientos y criterios técnicos para la evaluación y la Secretaría
de Educación Pública (SEP) y las autoridades educativas y los organismos descentrali-
zados correspondientes los implementan. Asimismo, es importante resaltar el caso de
Uruguay, donde las características de la evaluación docente varían de manera significativa
según el nivel educativo en el que enseña el docente. En Uruguay existen cinco consejos
educativos que están asociados a los distintos niveles y dirigen las políticas educativas en
cada uno de ellos de forma independiente.7 Esta división dificulta tanto el entendimiento
como el manejo del tema docente en el país (INEEd, 2017). En el caso de los concursos, por
ejemplo, mientras en el nivel primario se llevan a cabo concursos anuales, la periodicidad
de los concursos en el nivel secundario es mucho más espaciada. Además, los dos niveles
tienen requisitos e instrumentos diferentes. Por último, en Perú el Concurso de Ingreso a la
Carrera Pública Magisterial se realiza cada dos años y se compone de dos etapas. La pri-
mera etapa la ejecuta el Ministerio de Educación y consta de un examen, conocido como la
Prueba Única Nacional, en el que se evalúan habilidades generales y conocimientos disci-
plinares y pedagógicos. Quienes aprueban este examen son habilitados para presentarse a
la segunda etapa del concurso. Esta nueva etapa se efectúa en cada institución educativa
con plazas disponibles y está a cargo de un comité de evaluación, entre cuyos miembros
se encuentran el director y el subdirector o coordinador académico. En esta segunda etapa
se evalúan la experiencia, la formación docente y las capacidades didácticas y pedagógi-
cas del docente.
En lo referente a los requisitos para participar en los concursos, la mayoría de los paí-
ses exige que el candidato sea nacional o residente autorizado en el país, que goce de
7 Los consejos en Uruguay son: Consejo Directivo Central, Consejo de Educación Inicial y Primaria, Con-
sejo de Educación Secundaria, Consejo de Educación Técnico-Profesional y Consejo de Formación en
Educación.
64 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
buena salud y que no tenga antecedentes judiciales que le impidan trabajar en una escuela.
Los estatutos también detallan el nivel de formación inicial necesario para participar en el
concurso. Como se observa en el gráfico 4.4 (la tercera y la cuarta barras resumen los requi-
sitos educativos impuestos por cada país para ingresar al magisterio), solo el 42% de los
países exige que el interesado en ser docente público posea un título profesional univer-
sitario. En algunos casos el requisito del nivel educativo no está explícito y únicamente se
menciona, por ejemplo, la necesidad de tener un título “habilitante” sin dar más detalles al
respecto. De hecho, en muchos países, como Brasil, Colombia, Honduras, Trinidad y Tobago
y Uruguay, los estatutos docentes establecen de manera clara que los interesados con títu-
los académicos inferiores a los universitarios pueden presentarse al concurso para acceder,
generalmente, a un cargo docente en el nivel primario. Por ejemplo, en varios de estos paí-
ses se autoriza el ingreso a la profesión de individuos graduados de escuelas normales. Lo
fundamental, sin dudas, es que la formación que se dé en estas escuelas les brinde las herra-
mientas pedagógicas y disciplinares necesarias para un correcto desempeño profesional.8
Finalmente, al analizar si los estatutos exigen o no un título en pedagogía, se encon-
tró que solo en tres sistemas esto es obligatorio: provincia de Buenos Aires (Argentina),
Jamaica y Perú. En los sistemas restantes (el 85%) pueden participar en el concurso de
profesionales de otras áreas y si los aprueban, en la mayoría de los casos tienen un tiempo
máximo para complementar sus estudios con programas específicos en pedagogía mien-
tras ejercen la profesión.
Para mejorar los procesos de selección docente en la región es preciso contar con con-
cursos obligatorios para todo interesado en la carrera magisterial. No obstante, el punto
crucial que ayudará a la selección de candidatos idóneos para la labor dependerá de los
instrumentos evaluativos que estos tengan.9 El cuadro 4.2 resume los principales com-
ponentes que integran los concursos docentes en cada uno de los 17 sistemas analizados
donde existen y están reglamentados (por eso se excluyen de este listado Belice y Jamaica).
Entre ellos se destacan algunas particularidades. En la provincia de Buenos Aires (Argen-
tina) y Bolivia la reglamentación es clara respecto de que los concursos deben contener
exámenes de conocimiento y coloquios. Sin embargo, no existe información acerca de si
estos exámenes se aplican efectivamente y qué tipo de conocimientos evalúan cuando se
aplican. Debido a que en Chile la realización de los concursos está descentralizada y no
8 En varios países aún hay docentes sin título profesional trabajando en escuelas de enseñanza secunda-
ria. Por ejemplo, la revisión encontró que en países como Belice solo el 30% de los docentes en el nivel
secundario está entrenado para ser docente. De manera similar, en Uruguay, donde la proporción de
docentes con un título universitario pedagógico llega casi al 100% en la enseñanza primaria y es de las
más altas en la región, los niveles de titulación de los docentes en la enseñanza secundaria son mucho
más bajos. De acuerdo con el informe de la OCDE (2016) cerca del 50% de los docentes en ese nivel edu-
cativo no había completado su preparación universitaria según el censo de docentes de 2007.
9 El cuadro A4 del apéndice detalla para cada país los componentes de los concursos docentes de
acuerdo con lo establecido en la legislación.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 65
CUADRO 4.2 | N
úmero y tipo de instrumentos utilizados en los concursos docentes
en la región
País, provincia o ciudad al que Porcentaje de
Número de instrumentos incluidos pertenece el sistema educativo sistemas educativos
Ningún instrumento/sin información Chile, Costa Rica, El Salvador, 29%
Honduras, Panamá
Un instrumento
Examen de conocimiento Bolivia, Santa Catarina (Brasil), 29%
Guatemala, México, Uruguay
Entrevista Trinidad y Tobago 6%
Dos instrumentos
Examen de conocimiento y entrevista Provincia de Buenos Aires 24%
(Argentina), Colombia, Paraguay,
República Dominicana
Examen de conocimiento y clase demostrativa Ecuador 6%
Tres instrumentos
Examen de conocimiento, entrevista y clase demostrativa Perú 6%
Fuente: Elaboración propia a partir de Rodríguez y Rivera (2018).
se detallan los tipos de instrumentos utilizados se optó por dejar el caso como “sin infor-
mación disponible”. En Costa Rica, El Salvador, Honduras y Panamá se encontró que en
la práctica no se utiliza ningún instrumento para el reclutamiento de docentes nuevos en
el magisterio. En Costa Rica, El Salvador y Panamá la revisión determinó que la selección
de candidatos se basa en el análisis de los títulos académicos, los cursos realizados y la
antigüedad. En Honduras la evidencia sugiere que el sistema no tiene en cuenta aspectos
meritocráticos (FEREMA, 2015).
Teniendo en cuenta las aclaraciones respectivas, el análisis del cuadro permite dividir
los sistemas educativos en tres grandes grupos según el número y el tipo de instrumentos
utilizados en los concursos de ingreso al magisterio. En el primer grupo se ubican los sis-
temas de los que no se tiene información acerca del concurso o los que no utilizan ningún
instrumento para la selección de los docentes públicos que entran al magisterio. En la mayo-
ría de los casos solo se revisan los títulos académicos y en algunos casos particulares prima
la corrupción al momento de escoger los candidatos. Debido a que la calidad de muchos
de los programas de formación inicial en la región se encuentra cuestionada (Elacqua et al.,
2018) puede no estar asegurado que los candidatos seleccionados en estos sistemas estén
correctamente formados y cuenten con los niveles de conocimiento adecuados.
En el segundo grupo los sistemas educativos contemplan un único instrumento de
selección para definir si el candidato es idóneo para entrar a la fuerza docente pública,
el cual se basa generalmente en un examen de conocimiento. La inclusión de áreas eva-
luadas en estos exámenes varía según el país y pueden contar con aspectos disciplinares,
pedagógicos y/o psicotécnicos. Solo en el caso de Trinidad y Tobago el ingreso se basa
66 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
únicamente en una entrevista. El tercer grupo está compuesto por sistemas educativos que
dentro del proceso incluyen dos o más tipos de instrumentos; la mayoría utiliza una entre-
vista como instrumento adicional y complementario a los exámenes de conocimiento. Los
procesos de selección en Ecuador y Perú son únicos en la región. En Ecuador se incluye un
examen de conocimiento y una clase demostrativa. Perú es el único caso estudiados que
incluye tres instrumentos: examen de conocimiento, entrevista y clase demostrativa.
Expertos argumentan que los primeros años del ejercicio docente son críticos (Ávalos, 2016).
Por ejemplo, Jensen et al. (2012) indican que los docentes principiantes dedican un menor
tiempo efectivo de clase a actividades relacionadas con el aprendizaje, destinan más tiempo
para mantener el orden en su salón de clase y reportan menores niveles de autoeficacia en
la enseñanza comparados con docentes que tienen más años de experiencia. No sorprende,
por lo tanto, que estos primeros años de experiencia impacten también en la efectividad de
los docentes, medida a través del valor agregado en los aprendizajes. Diversos estudios de
Estados Unidos encuentran que las mejoras en la habilidad docente están concentradas en
los tres primeros años (Hanushek et al., 2005; Rivkin, Hanushek y Kain, 2005), a partir de los
cuales no hay retornos positivos (Chingos y Peterson, 2011). Para el caso latinoamericano,
Araujo et al. (2016) hallan resultados similares en Ecuador, donde los retornos a la experien-
cia docente se incrementan rápidamente en los primeros tres años, y luego se estabilizan.
Si a esto se suma el hecho de que en varios países de la región los docentes novatos
comienzan su experiencia laboral en escuelas que, en promedio, son vulnerables o están
en contextos vulnerables debido a la zona geográfica donde se ubican y las características
socioeconómicas de sus estudiantes (García et al. 2014), los programas que promueven la
adecuada inserción en el sistema resultan fundamentales. Diversos estudios realizados en
Estados Unidos sugieren que los docentes más efectivos se concentran en escuelas con
estudiantes de mayor nivel socioeconómico o con menor participación de estudiantes per-
tenecientes a minorías (Steele et al., 2015). En América Latina también hay evidencia de
una distribución inequitativa de docentes. Aunque no hay estudios que analicen directa-
mente la efectividad docente, algunas investigaciones revelan que los docentes menos
preparados y peor evaluados suelen trabajar en escuelas con estudiantes de menor nivel
socioeconómico (NSE) y peores resultados en las pruebas de aprendizaje. Bertoni et al.
(2018) analizan la distribución de docentes en escuelas públicas en Chile, Colombia y Perú
y encuentran que los docentes menos calificados (con menor experiencia y con contra-
tos temporales) suelen estar concentrados en escuelas con estudiantes de menor NSE,
particularmente en zonas rurales. De forma similar, en México los docentes con poca expe-
riencia y menor nivel educativo suelen concentrarse en escuelas rurales y con estudiantes
cuyos padres tienen un bajo nivel educativo (Luschei, Chudgar y Rew, 2013).
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 67
GRÁFICO 4.5 | Tipos de evaluaciones del período de prueba a las cuales están
sujetos los docentes principiantes
40% 37%
35% 32%
30%
25%
21%
20%
15%
11%
10%
5%
0%
No están definidas Están definidas en el estatuto Se aplica la misma Evaluaciones
en el estatuto/sin pero no se aplican/están evaluación obligatoria especialmente
información en proceso de diseño o periódica que a los diseñadas para los
aprobación final demás docentes maestros principiantes
presentar y aprobar algún tipo de evaluación, es necesario resaltar que la situación de jure
es distinta de la de facto. De hecho, en siete de dichos sistemas educativos las evaluaciones
para docentes principiantes no se aplican o no se encontró evidencia de que efectivamente
se llevan a cabo. Esto último ocurre en Bolivia, donde no existe evidencia de la aplicación de
algún período de prueba o de la realización de una evaluación a los docentes no normalistas
al cumplir cinco años de ejercicio de la profesión. En Belice, Costa Rica y República Domi-
nicana estas evaluaciones simplemente no se aplican. Por último, en Jamaica, Paraguay, y
Trinidad y Tobago, la información recolectada sugiere que las evaluaciones especialmente
diseñadas para esta etapa están en proceso de aprobación e implementación final o en
etapas de diseño, por lo cual no existe evidencia de que estén siendo aplicadas en su totali-
dad.10 Al agregar las primeras dos barras del gráfico 4.5 se explica que cerca de dos tercios
de los sistemas educativos de la región no tenían o no implementaban ningún tipo de eva-
luación para los docentes principiantes.
De acuerdo con la revisión, solo seis de los sistemas educativos de la muestra aplica-
ban algún tipo de prueba específica a los docentes principiantes: provincia de Buenos Aires
(Argentina), Santa Catarina (Brasil), Chile, Colombia, México y Panamá. El cuadro A7 del
apéndice detalla quién es el responsable directo de llevar a cabo la evaluación y cuáles son
los principales instrumentos utilizados en estos seis sistemas. En cuatro de estos sistemas
10 En Jamaica, los nuevos formatos de evaluación docente, incluso el de docentes principiantes, debían ser
aprobados en septiembre de 2017, fecha en la que también se esperaba el inicio de su implementación.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 69
los docentes principiantes están sujetos a la misma evaluación periódica que se aplica a los
demás docentes.11
Únicamente se encontraron dos casos que implementan evaluaciones específicas para
los docentes que están iniciando su carrera: el estado de Santa Catarina en Brasil y Colom-
bia. En provincia de Buenos Aires (Argentina), Colombia y Panamá la evaluación de prueba
al docente la efectúa el director o superior jerárquico sobre la base de formatos preestableci-
dos que, por lo tanto, poco pueden diferenciar realmente las habilidades y las debilidades de
los docentes. En Santa Catarina (Brasil), Chile y México, por el contrario, la evaluación se basa
en múltiples instrumentos y múltiples observadores. En Santa Catarina, la encargada es una
comisión evaluadora, un órgano central de la Secretaría de Educación del estado con repre-
sentación en cada escuela. El órgano central de la secretaría está compuesto por un gerente
de área, un coordinador y un servidor de área, mientras que la comisión escolar incluye al
director, a un oficial de dirección, a un asistente de educación, a un especialista en asuntos
educativos y a un representante de los docentes. En Chile, que aplica la evaluación perió-
dica, las pruebas a los docentes que cumplen dos años en el sistema las realizan evaluadores
mediante una multiplicidad de instrumentos. En México, por su parte, los encargados de la
evaluación de segundo año son el director, las autoridades educativas locales, la SEP y el
INEE. Como menciona el informe del INEE (2018), la evaluación que presentaron los docentes
en México al término de su segundo año, que de acuerdo con la reglamentación determina la
permanencia o no en el sistema, fue la misma que se aplicó a los docentes en servicio en 2015.
Excepto en Ecuador y Jamaica, la legislación que regula estas evaluaciones en los sis-
temas educativos analizados establece que los docentes principiantes tienen, en promedio,
dos oportunidades para aprobarlas; de lo contrario son retirados del sistema. Solo Jamaica
y Uruguay asumen las evaluaciones en esta etapa de la carrera de forma puramente forma-
tiva. Aunque la realidad es que el retiro de docentes casi nunca ocurre, incluso en países
como México donde las pruebas comprenden una multiplicidad de instrumentos y de eva-
luadores, y son más detalladas. Por ejemplo, el 99% de los docentes que ingresaron en
2015 y presentaron la evaluación del desempeño al término de su segundo año aprobó el
examen con una calificación de “Cumple con la función” (INEE, 2018).
Luego de que los individuos interesados en la docencia aprueban los procesos de selec-
ción, son contratados formalmente por el ministerio, entran en el escalafón docente y
superan el período de prueba —en los casos en que esto es un requisito— comienzan su
carrera profesional. El resumen de una cuidadosa revisión de la legislación que define y
11 En Chile el estatuto no establece un período de prueba ni una evaluación especial a los docentes
principiantes. Sin embargo, a los dos años de ejercicio todos ellos deben presentar las pruebas de la
evaluación de desempeño que se detalla en la siguiente sección.
70 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
estructura las evaluaciones obligatorias para los docentes que ya han sido nombrados en
sus cargos se encuentra en el cuadro A8 del apéndice. Allí se destacan los aspectos más
relevantes relacionados con las evaluaciones obligatorias como, por ejemplo, si están den-
tro de la legislación, su periodicidad, los instrumentos utilizados, las implicaciones que
conllevan sus resultados y, por supuesto, si efectivamente se implementan.
Al estudiar la legislación se advierte que en 17 de los sistemas educativos analiza-
dos los docentes del magisterio están sujetos a evaluaciones obligatorias periódicas.
El gráfico 4.6 resume la presencia en la legislación y la implementación de este tipo
de evaluaciones docentes, el tercero que se analiza en el capítulo. Como es posible
observar, en la gran mayoría de los sistemas educativos revisados en la región la legis-
lación menciona de manera explícita las evaluaciones obligatorias periódicas a las que
están sujetas los docentes nombrados en sus cargos y estas, en mayor o menor medida,
efectivamente se implementan. En Costa Rica y El Salvador, a pesar de que las evalua-
ciones obligatorias están definidas en los estatutos no se implementan. En Jamaica, la
reglamentación y el diseño de las evaluaciones periódicas se hallaban en un profundo
proceso de reforma en 2017, por lo cual fueron catalogadas de esa forma. Finalmente,
los únicos casos en los que los estatutos no mencionan la obligatoriedad de algún tipo
de evaluación docente se dan en Belice y en el estado de Santa Catarina, en Brasil. Por
tal motivo, los análisis de esta subsección expuestos a continuación excluyen de manera
intencional estos dos sistemas.
Las diferencias en el tipo de evaluación obligatoria que se aplica en los países de la
región son inmensas, y la primera característica que denota esto es la periodicidad con
las que las evaluaciones se efectúan. De acuerdo con la legislación, en 11 sistemas educa-
tivos de los 19 sistemas que integran el estudio los docentes están sujetos a evaluaciones
obligatorias que deben realizarse con una periodicidad anual: provincia de Buenos Aires
(Argentina), Bolivia, Colombia, Costa Rica, El Salvador, Guatemala, Jamaica, Panamá, Para-
guay, Trinidad y Tobago, Uruguay. En los seis sistemas educativos restantes (Chile, Ecuador,
Honduras, México, Perú y República Dominicana) la legislación establece que las evalua-
ciones obligatorias deben realizarse cada tres o cuatro años, dependiendo del país en
cuestión.12 Si bien la periodicidad con la que se llevan a cabo las evaluaciones obligatorias
12 Es necesario aclarar tres puntos al respecto. El primero es que en Honduras la evaluación consta de
dos partes: una interna, en la escuela, que debe realizarse cada año y una externa que debe efectuarse
cada tres años. De acuerdo con esta última característica se ha clasificado al país en el segundo grupo.
El segundo punto es que en 2017 Paraguay empezó una prueba piloto de un nuevo modelo de evalua-
ción docente. Sin embargo, no hay evidencia de que se esté implementando una evaluación detallada
de manera sistemática en este momento. Aunque la reglamentación actual establece que la evaluación
debe llevarse a cabo de forma anual, si el nuevo modelo comienza a ser implementado de manera cen-
sal para los docentes del país quizás su periodicidad cambie. El tercer punto es que la reglamentación
en República Dominicana indica que las evaluaciones deben realizarse en un período no mayor de tres
años, pero no fija una periodicidad exacta.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 71
MÉXICO REPÚBLICA
DOMINICANA
JAMAICA
BELICE
HONDURAS
GUATEMALA
EL SALVADOR TRINIDAD Y TOBAGO
PANAMÁ
COSTA RICA
COLOMBIA
ECUADOR
PERÚ
BRASIL
BOLIVIA
CHILE PARAGUAY
URUGUAY
ARGENTINA
podría parecer un punto menor, lo cierto es que conlleva un sinnúmero de diferencias que
incluyen la probabilidad de que dichas evaluaciones se realicen efectivamente, los instru-
mentos utilizados y las repercusiones que surgen de los resultados, entre otras.
El cuadro 4.3 divide los 17 sistemas educativos analizados que mencionan las eva-
luaciones obligatorias periódicas en su legislación en dos grupos de acuerdo con la
periodicidad en ella definida: anual, y entre tres y cinco años. Su análisis pone en eviden-
cia dos diferencias claras que surgen en las evaluaciones obligatorias de acuerdo con esta
división. La primera es que mientras en todos los sistemas que establecen una periodici-
dad de evaluación obligatoria de entre tres y cinco años las evaluaciones efectivamente
se implementan, en los sistemas donde la periodicidad es anual este porcentaje baja a
menos de la mitad.13
La segunda diferencia tiene que ver con el tipo de evaluación que se implementa.
Según la revisión de la literatura especializada, para que las evaluaciones a docentes
logren realmente impactar de manera positiva en la práctica pedagógica de los maestros
y con ello en la calidad de la educación que reciben los estudiantes es necesario que las
evaluaciones cuenten con múltiples instrumentos (MET, 2013). Debido a la complejidad
de la labor docente, solo a través de distintos instrumentos es posible tratar de observar
las numerosas facetas que debe alcanzar un profesional de la educación. Como queda
claro en el cuadro 4.3, mientras todos los sistemas que implementan estas evaluaciones
13 En este grupo únicamente fueron clasificados los sistemas educativos en los que fue posible verificar
la implementación de una evaluación estandarizada para todos los docentes. Por eso solo entran en el
grupo cinco sistemas educativos de los 11 sistemas que tienen una evaluación obligatoria con periodi-
cidad anual: Colombia, Guatemala, Panamá, Paraguay y Uruguay. La revisión permitió concluir que en
Costa Rica y El Salvador las evaluaciones no se aplican. En el caso de Jamaica, a septiembre de 2017 los
formatos finales de la nueva evaluación debían ser aprobados, por lo cual hasta ese momento aún no
se estaban implementando. Para provincia de Buenos Aires (Argentina), Bolivia y Trinidad y Tobago no
fue posible encontrar evidencia de que efectivamente las evaluaciones se implementasen de manera
continua y estandarizada. Por otro lado, en el caso de Ecuador, a agosto de 2018 todavía no había sido
posible la implementación de la totalidad de los instrumentos establecidos en la legislación.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 73
obligatorias con una periodicidad de entre tres y cinco años utilizan múltiples instru-
mentos, este porcentaje llega solo al 27% en los sistemas donde la periodicidad es anual.
Es importante aclarar cuáles son los tres sistemas que integran el grupo con evaluacio-
nes anuales y fueron catalogados como sistemas que utilizan múltiples instrumentos.
El primero es Jamaica, que, como se explicó anteriormente, en 2017 se encontraba en
un proceso de transformación de la evaluación docente. Aunque los formatos y la legis-
lación en torno de los requisitos de la evaluación docente obligatoria anual estaban ya
definidos e incluían el uso de distintos instrumentos, estos aún no se implementaban en
el país. El segundo sistema es el de Paraguay, el cual introdujo también en 2017 un nuevo
esquema de evaluación docente con múltiples instrumentos cuyo piloto debía comenzar
a aplicarse a finales de año. El tercer país es Uruguay del cual se podría decir que, debido
a la división administrativa de los distintos niveles educativos a través de los cinco con-
sejos educativos, la evaluación únicamente funciona para los docentes que trabajan en
el nivel primario. Si estos aspectos se tuviesen en cuenta, el porcentaje podría ser incluso
menor del 27%.
Las evaluaciones que incluyen múltiples instrumentos, y están correctamente diseña-
das e implementadas, son costosas en tiempo y dinero. Pensar en aplicarlas de manera
censual y anual a todos los docentes de un país se convierte en un objetivo de política edu-
cativa inviable. Por eso no sorprenden las enormes diferencias que existen en el uso de
múltiples instrumentos entre ambos grupos de sistemas. Más importante aún es el hecho
de que esto deja en claro una lección de política educativa: evaluaciones obligatorias
censales detalladas, que aporten información valiosa y que efectivamente sean implemen-
tadas, no pueden llevarse a cabo anualmente.
La siguiente pregunta que surge en el diseño de política evaluativa es, naturalmente,
qué tipo de instrumentos incluir en estas evaluaciones. Como se mencionó en el segundo
capítulo, existe una multiplicidad de instrumentos, cada uno de los cuales tiene sus ventajas
y desventajas. La totalidad de los sistemas educativos que implementan las evaluaciones
obligatorias anualmente y cuentan con un único instrumento utilizan un reporte del direc-
tor de la escuela. Estos reportes buscan contemplar aspectos relacionados con la gestión
académica, la administrativa y la comunitaria, así como el comportamiento de los docen-
tes. Sin embargo, al ser un reporte básico, que no debe ser complementado con evidencia
específica para cada aspecto, termina siendo un instrumento que aporta poca información
relevante de las habilidades docentes que pueda utilizarse en pro de la mejora profesional
de los maestros y de la calidad educativa del país en general. En ese sentido, es inte-
resante analizar la experiencia en los países que implementan evaluaciones obligatorias
con múltiples instrumentos en la región. El resumen de estas decisiones y el número total
de instrumentos utilizados en cada país de acuerdo con la legislación se encuentra en el
cuadro 4.4.
Como es posible observar, el país con el mayor número de tipos de instrumentos men-
cionados en la legislación es Ecuador (seis tipos de instrumentos), seguido por Honduras y
74 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
14 Es importante hacer una salvedad respecto del número de instrumentos utilizados en la evaluación de
desempeño de tres sistemas. En Chile, de acuerdo con los artículos 12 al 17 del Decreto Nº 192 del Regla-
mento sobre evaluación docente, los instrumentos que deben ser utilizados en cada evaluación docente
son: i) autoevaluación, ii) entrevista con par evaluador, iii) informes de referencia de terceros, iv) portafolio
del docente. Este último instrumento tiene a su vez tres módulos: i) unidad pedagógica, ii) video de clase
y iii) trabajo colaborativo. Según lo apreciado en esta revisión, la observación en clase es un instrumento
muy relevante en la región. Por eso se optó por tratarlo como un instrumento adicional. Así es que Chile
suma cinco instrumentos en lugar de cuatro. En Ecuador y Honduras, los sistemas de evaluación inclu-
yen tanto encuestas a padres de familia como encuestas a estudiantes, por lo que si se consideran estos
dos instrumentos independientemente se podría decir que usan un total de siete y seis, respectivamente.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 75
incluyen el análisis de un portafolio son Perú, República Dominicana y Uruguay. Los ins-
trumentos que se mencionan con menor frecuencia en las legislaciones de los países son
el examen de conocimientos —existe en la legislación de Ecuador, Honduras y México— y
las encuestas a estudiantes y/o padres de familia —contempladas por Ecuador, Honduras y
Perú—.Finalmente, solo Chile y Honduras incluyen como instrumento los reportes de pares,
mientras que en Perú y República Dominicana se emplean instrumentos específicos para
evaluar la gestión del espacio y la responsabilidad (en Perú se utilizan ambos y en Repú-
blica Dominicana se usa solo el último instrumento mencionado).
Para que una evaluación otorgue información certera, válida y confiable se requiere, ade-
más de la mención de multiplicidad de instrumentos, su utilización efectiva. Asimismo, hay
aspectos relacionados con su diseño —como quiénes son los encargados de llevarla a cabo
y qué actores participan en cada etapa— que impactan de manera importante en los resulta-
dos. Como en el grupo de países que usan un único instrumento todos utilizan el reporte del
director o superior jerárquico este es el actor principal sobre el cual recae la responsabilidad
de la evaluación. El punto interesante es, por lo tanto, analizar qué actores intervienen en los
países que tienen una evaluación obligatoria con múltiples instrumentos. Una primera apro-
ximación a esta cuestión se presenta en el cuadro 4.5, que muestra qué tipo de evaluadores
están involucrados en los procesos de evaluación en cada uno de estos países.
Llama la atención que a pesar de que no todos los países incluyen un reporte del direc-
tor o del superior jerárquico como instrumento este actor participa de una u otra forma en los
procesos de evaluación obligatoria en todos estos países. Específicamente, en Perú el director
CUADRO 4.5 | A
ctores que participan en la evaluación obligatoria periódica en
países con múltiples instrumentos
Director/superior Propio Expertos Estudiantes/
País inmediato Par docente calificadores padres
Dos evaluadores
Uruguay
Tres evaluadores
Jamaica
México
Paraguay
Perú
República Dominicana
Cuatro o más evaluadores
Chile
Ecuador
Honduras
Frecuencia evaluador 100,0% 55,6% 77,8% 77,8% 33,3%
Fuente: Elaboración propia sobre la base Rodríguez y Rivera (2018).
76 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
forma parte del Comité de Evaluación de Desempeño Docente, conformado también por el
subdirector o coordinador del nivel y un profesor del mismo nivel educativo que el profesor
por evaluar (o de un nivel superior) perteneciente a otra institución educativa. En Paraguay, el
director y un par docente son los encargados de llevar a cabo la observación en clase.
Los segundos actores más comúnmente involucrados en estas evaluaciones con múlti-
ples instrumentos son un experto externo a la institución o escuela y el propio docente. La
inclusión de evaluadores externos es, sin dudas, un aspecto positivo que vale la pena resal-
tar. La ventaja de tener este tipo de evaluadores es que pueden brindarles tranquilidad a los
docentes respecto de que, en principio, sus resultados van a estar ausentes de subjetivida-
des por quien calificará su labor en el día a día. Los países en los que la autoridad educativa
(ministerios o consejos, en el caso de Uruguay) diseña las evaluaciones, pero asigna perso-
nal externo a las instituciones para llevar a cabo parte de ellas han sido catalogados en un
primer nivel de independencia. Por ejemplo, en Uruguay la evaluación externa, correspon-
diente a la observación de clase, está a cargo de individuos conocidos como inspectores,
quienes reportan directamente a los consejos respectivos. En Paraguay, el papel de evalua-
dor externo lo cumple un par académico de otra institución educativa. En un segundo nivel
de independencia se encuentran Honduras y República Dominicana. En Honduras existe
la Dirección General de Currículo y Evaluación, que integra la Secretaría de Educación y
se encarga de coordinar todo el proceso de las evaluaciones docentes, desde el diseño de
los exámenes de conocimiento hasta el entrenamiento y la designación de los observado-
res externos. En República Dominicana, el encargado del diseño y la implementación de la
última evaluación docente es el Instituto Dominicano de Evaluación e Investigación de la
Calidad Educativa, un organismo de carácter técnico adscrito al Ministerio de Educación.15
En Chile, y Ecuador hay instituciones independientes que se ocupan del diseño de la evalua-
ción y de su ejecución, lo cual le otorga aun mayor independencia al proceso: el Centro de
Medición MIDE, de la Escuela de Psicología de la Pontificia Universidad Católica de Chile; el
Instituto Nacional de Evaluación Educativa en Ecuador. La existencia de estas instituciones
permite que, con distintos niveles, el diseño y la implementación de la evaluación obligatoria
tengan la autonomía técnica suficiente para evitar que las decisiones en torno de ella depen-
dan de preferencias o presiones del gobierno o del ministerio de turno.
El 77,8% de los países analizados también incluye como actor al propio docente (véase
el cuadro 4.5). Esta categoría incluye, además de la obvia participación del docente como
sujeto evaluado, un papel específico como instrumento de autoevaluación de su propia
15 Como se señaló anteriormente, en Colombia el director es el único actor encargado de llevar a cabo la
evaluación periódica obligatoria. Sin embargo, vale la pena mencionar que este país cuenta también con
el Instituto Colombiano para la Evaluación de la Educación, una entidad especializada del Ministerio de
Educación nacional que se encarga de la realización de los exámenes de conocimiento a estudiantes
(examen de estado en grado 11º y las Pruebas Saber 3º, 5º y 9º) y las evaluaciones docentes asociadas a
la entrada en la carrera y a las posibilidades de ascenso profesional, esta última descrita más adelante.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 77
CUADRO 4.6 | P
eso promedio asignado a cada instrumento en los países que
utilizan instrumentos múltiples en las evaluaciones obligatorias
periódicas de docentes
Reporte
director o Padres de
superior Evaluación Observación familia/
País jerárquico de pares Autoevaluación Portafolio en clase Examen estudiantes Otros
Paraguay 10% 90%
Chile 10% 20% 10% 17% 34% 10%
Ecuador 5% 18% 8% 17% 48% 4%
Honduras 15% 15% 30% 30% 10%
Perú 50% 17% 33%
República 15% 10% 45% 20% 10%
Dominicana
Promedio 11% 17% 13% 19% 43% 33% 9% 16%
Fuente: Elaboración propia sobre la base de Rodríguez y Rivera (2018).
Nota: En Honduras, el porcentaje asignado a la evaluación de pares (15%) incluye la observación en clase.
16 Los pesos para cada principio guía son: i) conocimiento disciplinar, el 23%; ii) conocimiento pedagógico,
el 23%; iii) liderazgo profesional, el 23%; iv) manejo de la diversidad de estudiantes, el 14%; v) continuo
mejoramiento de habilidades profesionales, el 9%; vi) relaciones con padres de familia, el 8%.
17 No se encontró información con respecto al peso que se le otorga al puntaje dado por cada uno de
estos evaluadores. Sin embargo, de acuerdo con el informe de OCDE (2016), la calificación final debe
aprobarse en una reunión anual de la cual participan tanto inspectores como directores, y donde estos
últimos tienen voz, pero no voto.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 79
haber recibido visitas de un inspector en 2015, mientras que este porcentaje baja al 14% en
la secundaria (INEEd, 2017). De manera similar, aunque la legislación de Ecuador menciona
que la evaluación docente debe incluir siete instrumentos, la realidad es que a septiembre
de 2017 únicamente se había logrado la implementación de manera censal de uno de ellos:
el examen de saberes disciplinares.
Por otra parte, aunque se implementen todos los instrumentos mencionados en la
ley, su forma de implementación y su calidad pueden variar de forma significativa de un
país a otro, como se señaló anteriormente para el caso de los sistemas educativos de alto
desempeño. Por ejemplo, en Chile para llevar a cabo la observación en clase (incluida en
el módulo 2 del portafolio) se invita al docente a mostrar su trabajo en el aula a través de
la grabación de una clase de 40 minutos. Esta grabación, que debe realizar una persona
autorizada por Docentemás (responsable de desarrollar las distintas acciones y materiales
que requiere el proceso de evaluación) y es gratuita para el docente, luego es evaluada por
equipos de docentes de aula en ejercicio en universidades (no son profesores o estudian-
tes universitarios, como se dice de manera equívoca frecuentemente), bajo la supervisión
y el entrenamiento de Docentemás (Docentemás, 2017). Estos docentes de aula tienen for-
mación, y experiencia, en el mismo nivel, la misma asignatura o la misma modalidad de los
docentes cuyos portafolios corrigen. Además, si bien estos docentes reciben rúbricas de
calificación detallada que buscan asegurar la calidad del trabajo, el 20% de los portafolios
es calificado por dos equipos distintos.
De manera similar, es interesante destacar el esfuerzo realizado en República Domi-
nicana donde, con la ayuda de la Organización de Estados Iberoamericanos, el gobierno
puso en marcha un proceso censal de observación en clase, que abarca casi 60.000 docen-
tes, con observadores especialmente entrenados para tal fin. A diferencia de Chile, en este
país la observación se efectúa en las propias escuelas. Precisamente por la logística, no
fue posible hacer la revisión de casos aleatorios o particulares. Por otro lado, en Ecuador,
debido a restricciones presupuestales y técnicas, el Instituto Nacional de Evaluación Edu-
cativa tomó la decisión de no llevar a cabo la evaluación de prácticas pedagógicas a través
de la observación de clase. La opción que permitirá realizar una valoración de práctica de
aula de manera viable en el país es la utilización de un instrumento digital que consiste en
presentar a los docentes una serie de videos con ejemplos específicos acerca de situacio-
nes cotidianas dentro del aula de clase para que luego los maestros respondan preguntas
de opción múltiple mediante la elección de aquellas alternativas que les parezcan más per-
tinentes para ejecutar en el aula. A fin de 2018, sin embargo, esta etapa de la evaluación
aún no había sido aplicada.
Otra de las cuestiones importantes identificadas por la revisión indica que la diferen-
ciación de los docentes de acuerdo con sus habilidades pedagógicas y su conocimiento
disciplinar depende, además de los instrumentos y de su implementación, de las catego-
rías o calificaciones que derivan de las evaluaciones. El cuadro A9 del apéndice presenta
el análisis para los sistemas en donde la legislación menciona la evaluación obligatoria
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 81
12%
17%
24%
38%
70%
35%
México Ecuador
4% 0%
6% 7%
8%
22%
26%
56% 71%
Perú
1%
99%
Aprobado No aprobado
Fuente: Elaboración propia sobre la base de Rodríguez y Rivera (2018).
y muestra las calificaciones que los docentes pueden obtener en ella. Seis sistemas
optaron por asignar un puntaje continuo con niveles específicos que generan, o no,
repercusiones en las carreras de los docentes. En los nueve países restantes la legisla-
ción establece que la calificación otorgada en el proceso evaluativo es categórica. De
hecho, más de la mitad de estos sistemas define cuatro categorías en las que un docente
puede quedar clasificado de acuerdo con sus resultados. Solo tres países optaron por
un número especial de categorías. Para Perú la evaluación consiste en si el docente
aprobó o no; para Colombia consta de tres categorías y finalmente en Costa Rica se
82 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
optó por cinco. En el gráfico 4.7 se reportan los resultados más recientes disponibles de
la evaluación docente periódica obligatoria para Chile, Ecuador, Honduras, México, Perú
y República Dominicana.
El número de categorías importa para la diferenciación docente, pero más categorías
no necesariamente implican una mejor diferenciación. Costa Rica, que definió el mayor
número de categorías, ni siquiera implementa la evaluación. De la misma manera, para la
mayoría de los sistemas que utilizan evaluaciones docentes anuales, los posibles punta-
jes —basados en el reporte del director— son numéricos y continuos, dando una amplia
posibilidad de diferenciación. Sin embargo, se estima que una parte significativa de los
docentes de estos sistemas son catalogados con puntajes concentrados en categorías
de buenos o sobresalientes. Además, en estos casos una diferenciación amplia en punta-
jes entre los docentes no resolvería la baja calidad de los reportes de los directores, que
impide brindar información valiosa al docente y a las autoridades educativas con respecto
a su desempeño laboral.
En el otro extremo se encuentra Perú, donde la evaluación define únicamente dos
categorías: aprobó o no aprobó. Sin embargo, al contar con múltiples instrumentos que
incluyen la observación en clase, la información recolectada en el proceso puede ser muy
valiosa si se usa de manera adecuada. Por ejemplo, la evaluación de docentes de jardines
infantiles implementada en 2017 en ese país reportó que el 99,3% de los docentes que par-
ticiparon en el proceso aprobó la evaluación. Sin embargo, el análisis de los resultados de
la rúbrica de observación en clase para estos docentes permite observar la variación sig-
nificativa existente en aspectos relacionados con el trato del docente a los estudiantes, su
sensibilidad ante ellos y la promoción de autonomía y habilidades de lenguaje; e identifi-
car quiénes requieren mejoras específicas en dichos aspectos. Una situación similar ocurre
en Chile, donde en 2015 el 82% de los maestros fueron calificados como competentes o
destacados, pero que, al analizar los puntajes obtenidos en el instrumento de portafolio
el porcentaje bajó al 37%. La información contenida en esta herramienta es precisamente
la que permite entender cuáles son las fortalezas de cada docente y en qué aspecto
específico es fundamental que mejore. Por último, es útil mencionar también la eviden-
cia recolectada en República Dominicana durante la evaluación docente más reciente. De
acuerdo con informes del ministerio, la calificación relacionada con la autoevaluación y el
reporte del superior inmediato sugiere que más del 80% de los docentes recibe una cali-
ficación superior, pero los resultados de los instrumentos vinculados con la observación
en clase y los análisis de planificación y rendimiento profesional son muy distintos: según
estos tres instrumentos, solo el 40% de los docentes está en la categoría superior. Ade-
más, hallan deficiencias específicas en la probabilidad de que los docentes activen en sus
alumnos conocimientos previos, orienten a sus alumnos en actividades dirigidas a la inves-
tigación o incluso hagan un uso óptimo del tiempo destinado a la clase.
Dentro del estudio de las evaluaciones obligatorias implementadas en la región se ana-
lizan también las consecuencias que se derivan de los resultados de cada una, algo que,
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 83
por supuesto, está ligado a los objetivos que estas buscan alcanzar. El gráfico 4.8 resume
la información recolectada en la revisión, para lo cual divide nuevamente a los países de
acuerdo con la periodicidad de las evaluaciones (las consecuencias ligadas a la evaluación
obligatoria para cada país se detallan en el cuadro A10 del apéndice). En los sistemas edu-
cativos con evaluaciones obligatorias que tienen una periodicidad de entre tres y cinco años
las consecuencias más comunes se producen en la permanencia de los docentes (el 67% de
los casos) y en la posibilidad de formación y ascenso (el 50% de los casos). En los sistemas
educativos con evaluaciones anuales estos porcentajes bajan al 27% y al 9% para permanen-
cia y formación, respectivamente, y la cifra sube al 72% para el caso de los ascensos.
Respecto de la consecuencia de permanencia, por lo general en ambos grupos la
legislación establece que el docente debe obtener un puntaje mínimo en la evaluación
obligatoria periódica para asegurar su permanencia dentro del magisterio. En caso de que
el docente no alcance este puntaje tiene entre una y dos oportunidades adicionales para
obtenerlo. En los sistemas con evaluación anual esto ocurre durante el año inmediata-
mente posterior y en los sistemas con evaluaciones más espaciadas la reglamentación,
por lo general, lo fija así también. Si en estas evaluaciones adicionales el docente tampoco
alcanza el puntaje mínimo, la legislación estipula que debe ser removido del cargo. Sin
embargo, en los países de la región, sin importar el tipo de evaluación periódica que imple-
menten, casi nunca los docentes son alejados de las aulas por un mal desempeño en las
pruebas obligatorias periódicas.
En el caso de las implicaciones que tienen los resultados de la evaluación en los pro-
cesos de formación docente una vez más lo que dice la ley no es necesariamente lo que
67%
Consecuencias en permanencia
27%
50%
Consecuencias en formación
9%
se aplica en la realidad. Entre los sistemas con evaluaciones anuales solo Paraguay ata
los resultados directamente a programas de formación en servicio. Sin embargo, en la
práctica, a 2017 Paraguay no había implementado este eje. Entre los sistemas con eva-
luaciones con múltiples instrumentos, Chile, México y Perú incluyen esta consecuencia de
manera específica en la legislación. Sin embargo, aunque se han logrado avances al res-
pecto, la escasa evidencia que existe sugiere que aún falta mucho camino por recorrer
en este aspecto para dichos sistemas también. Chile ha venido llevando a cabo procesos
de formación ligados a los resultados obtenidos en la evaluación de manera continua.
Cortés et al. (2011) analizan algunos aspectos relacionados con los Planes de Superación
Profesional (PSP) en Chile y concluyen que los esfuerzos realizados son valiosos, pero
aún hay espacio para mejorar. En particular los autores sugieren la necesidad de asegurar
la calidad de la formación, que en el momento en que se hizo el estudio era una decisión
descentralizada y, por tanto, generaba calidades de capacitaciones muy distintas según
el municipio; y señalan la importancia de efectuar las capacitaciones en horarios labora-
les de los maestros. Asimismo, los autores recalcan que su trabajo no es una evaluación
de impacto, y que debido a la trascendencia del tema es fundamental realizar una eva-
luación de este tipo.
México ha realizado varias rondas de evaluaciones, pero según las propias autoridades
educativas aún no se ha logrado integrar los programas de formación dentro del proceso
(Schmelkes, 2017). Santibáñez, Rubio y Vázquez (2017) analizan la Estrategia Nacional de
Formación Continua y Desarrollo Profesional en ese país y concluyen que los esfuerzos
de las autoridades educativas federales y estatales han permitido la mejora de la articu-
lación entre la evaluación y los procesos de formación. Por ejemplo, al ser una formación
a distancia —única alternativa posible en la actualidad de acuerdo con las autoridades—
es altamente valorado el involucramiento de instituciones de educación superior de alta
reputación como encargadas de la formación. De todos modos, el estudio encontró que
existe amplio espacio para desarrollar una mayor capacitación previa de los docentes
en el conocimiento de herramientas de tecnología de la información, ya que se trata de
una modalidad a distancia; y para asegurar la calidad de la formación impartida. De igual
forma, el estudio señala que hacen falta mayores recursos invertidos en este eje funda-
mental. Como en el caso de Cortés et al. (2011), el estudio para México no constituye una
evaluación de impacto, lo cual deja en claro el vacío que existe en la región respecto de
este factor esencial dentro de la teoría de cambio. Finalmente, en el caso de Perú, aunque
la legislación establece que de no aprobar la evaluación el docente debe recibir una capa-
citación, no fue posible encontrar evidencia de que esto efectivamente esté sucediendo
en la práctica.
El gráfico 4.8 evidencia también que para los sistemas con evaluaciones obligatorias
anuales es mucho más común utilizar sus resultados como insumo o requisito al momento
de analizar los ascensos dentro de la carrera que para los sistemas con evaluaciones cuya
periodicidad es de tres a cinco años. Entre los sistemas educativos con evaluaciones
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 85
a las que realizan en su cotidianidad como docentes. De manera similar, el 86% de los
docentes creen que realizar el portafolio es útil o muy útil para mejorar la reflexión de sus
prácticas pedagógicas (Docentemás, 2017). El tercer tipo de investigaciones está relacio-
nado con la pertinencia de las evaluaciones y los instrumentos. Como se mencionó en el
capítulo 2, estudios como el de Taut et al. (2016) han encontrado correlaciones entre la
calificación obtenida por los maestros en el portafolio y medidas de valor agregado de
los estudiantes.
La segunda experiencia es la de México, que ha investigado el funcionamiento de sus
sistemas de evaluación obligatoria y los impactos que ha traído la puesta en marcha de
estos sistemas en el progreso en la carrera docente. Por ejemplo, después de la evaluación
de desempeño implementada en 2015, el INEE, con la colaboración de la Oficina Regio-
nal de Educación de la UNESCO para América Latina y el Caribe (OREALC/UNESCO),
llevó a cabo la evaluación de su implementación, que incluía, entre otros aspectos, una
encuesta de satisfacción a 10.000 docentes y grupos focales con cerca de 410 docen-
tes. Los resultados de estas investigaciones impulsaron una reforma en el modelo de
evaluación obligatoria a partir de 2017. De manera complementaria, México cuenta con
investigaciones que buscaban determinar el impacto de aspectos específicos de algunas
reformas como la de Estrada (2019) y la de Santibáñez et al. (2006), referenciadas en el
capítulo 2, que evaluaron las pruebas de entrada a la carrera y la introducción del Programa
de Carrera Magisterial, respectivamente.
Aunque todos estos esfuerzos son valiosos, resulta claro que hacen falta más investi-
gaciones en la región que analicen la validez y la consistencia de los resultados que estas
nuevas evaluaciones arrojan, así como los impactos en los docentes y los propios alumnos.
analizados ofrecen esta posibilidad a sus docentes, quienes en general pueden alcanzar
estos cargos a través de concursos especialmente creados para ese fin.
Los ascensos horizontales, por su parte, son aquellos que les permiten a los docentes
incrementar el prestigio, las funciones, las responsabilidades y el salario sin la necesidad
de abandonar las aulas de clase. A diferencia de lo que ocurre con los ascensos verticales,
no todos los docentes en la región pueden ascender de manera horizontal en su carrera.
De acuerdo con el análisis de los estatutos docentes en este aspecto particular es posi-
ble dividir los sistemas educativos en tres grupos, reflejados en el gráfico 4.9, según las
posibilidades de ascensos horizontales y los requisitos que deben cumplir los docentes
para obtenerlos.
El primer grupo está conformado por los sistemas educativos cuyos estatutos docentes
ni siquiera reglamentan categorías diferenciadas de los docentes, al margen de distinguir-
los entre los que están contratados de forma permanente y los que no lo están. Se las
llama carreras completamente burocráticas porque su reglamentación no les otorga a los
Fuente: Elaboración propia sobre la base de los datos de Rodríguez y Rivera (2018).
88 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
país, en tanto que ascender a los últimos dos tramos es un proceso voluntario. Además
de completar los años de experiencia requeridos, los docentes expertos deben obtener
los mejores resultados en los dos instrumentos de la evaluación de desempeño: el porta-
folio y la evaluación de conocimientos específicos y pedagógicos. En Jamaica existen tres
categorías para docentes de aula: principiante, efectivo y master. Mientras ascender de
principiante a efectivo es obligatorio si se quiere continuar en la carrera, ascender a la cate-
goría de master es opcional.
El detalle de la carrera, las posibilidades de ascenso y los requisitos para alcanzarlos
se presentan en el cuadro A12 del apéndice para todos los sistemas. Por supuesto, solo es
posible e interesante analizar los requisitos exigidos para ascender para los países cata-
logados en el tercer grupo del gráfico 4.9. El cuadro 4.7 reseña los instrumentos que, de
acuerdo con lo establecido en la legislación, deben ser utilizados al momento de evaluar
los ascensos horizontales en esos 12 países, al margen de los requisitos vinculados con el
tiempo de servicio o la experiencia exigidos en cada sistema. Llama la atención que cerca
del 70% de los países incluye como requisito un componente relacionado con la evaluación
obligatoria periódica descrita en la sección anterior, lo cual lo convierte en el insumo más
20 Por ejemplo, cada video debe estar enfocado en la práctica educativa, pedagógica, didáctica y de aula,
en una de las clases que imparte el docente. El desarrollo de la clase debe incluir tres momentos: 1) con-
textualización, ii) desarrollo de la clase, 3) reflexión final (información extraída de la página Maestro
2025 en 2017).
92 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
Resulta clara la importancia que les otorgan a las prácticas pedagógicas, la planificación
y los conocimientos disciplinares pues son los aspectos más evaluados al definir los movi-
mientos horizontales en la carrera. En casi la mitad de los países se incluye un proceso de
autoevaluación y reflexión del docente y en menor proporción algunos contemplan la per-
cepción que tienen los superiores, los estudiantes y los padres de familia o la capacidad de
hacer investigación del propio docente como criterios de evaluación.
Al existir múltiples instrumentos, surge la pregunta respecto del peso que las autori-
dades educativas le asignan a cada uno de ellos. A diferencia del caso de las evaluaciones
obligatorias periódicas, no es posible resumir la información de manera que cada instru-
mento obtenga un peso específico ya que, como se mencionó antes, muchos de los países
que integran este grupo utilizan como insumo información previamente recolectada en las
evaluaciones obligatorias. Por ejemplo, en Chile, el nivel en el que queda un docente en
el escalafón depende tanto del puntaje obtenido en el instrumento del portafolio (que en
este informe incluye la observación en clase y la planeación) como del examen de conoci-
miento. 21 En México los ascensos dependen exclusivamente de la calificación final que el
docente obtuvo en la evaluación obligatoria y del examen adicional que debía ser determi-
nado por el INEE, mientras que en Ecuador se basan en el puntaje logrado en el examen de
conocimientos disciplinares. Solo en Colombia y Paraguay es posible asignarles una pon-
deración específica a todos los instrumentos. En Colombia, la observación en clase pesa
un 80%, los puntajes obtenidos en la evaluación obligatoria de los dos años previos pesan
21 El gráfico A3 del apéndice muestra las combinaciones de puntajes que deben obtener los docentes en
Chile para ascender a cada una de las categorías.
SITUACIÓN DE LOS SISTEMAS DE EVALUACIÓN DOCENTE EN AMÉRICA LATINA Y EL CARIBE 93
22 En el caso de Jamaica la legislación no es clara y no permite asignar un peso específico a los instrumen-
tos que se utilizan al momento de escoger a los maestros.
23 La única excepción es la evaluación de impacto de Santibáñez et al. (2006) relacionada con el Programa
de Carrera Magisterial anteriormente mencionado. Sin embargo, este programa fue eliminado y reem-
plazado en las reformas recientes por la Ley de Servicio Profesional Docente.
CINCO CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA 95
CAPÍTULO 5
95
96 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
Segundo, es indispensable tener en claro qué objetivo se desea alcanzar con la implemen-
tación de las evaluaciones docentes. Las evaluaciones docentes pueden tener dos fines
generales: i) mejorar las prácticas y habilidades pedagógicas y/o disciplinares de los docen-
tes, y ii) mejorar la composición y motivación de la fuerza docente a través de incentivos
positivos o negativos. Lograr ambos objetivos con una única herramienta o tipo de evalua-
ción es difícil, ya que los docentes estarán más o menos dispuestos a revelar sus verdaderas
falencias o habilidades dependiendo del objetivo buscado. Una evaluación que tiene un
objetivo formativo puede permitir que el docente actúe con mayor naturalidad y honestidad
a la hora de ser evaluado, porque sabe que esto puede traducirse en un apoyo para mejorar
su práctica docente. Por otro lado, una evaluación que tiene consecuencias laborales puede
llevar a que el docente enfoque su práctica de enseñanza exclusivamente en los aspectos a
ser evaluados para poder lograr los beneficios o evitar las consecuencias negativas.
Por lo tanto, no es de extrañar que ciertos casos analizados —tanto en los sistemas
educativos de alto desempeño como en algunos de la región— recurran a la implemen-
tación de diferentes tipos de evaluaciones, en función del tramo de la carrera en el que
se encuentre el docente y del objetivo que buscan alcanzar. El análisis sugiere que esta
división de objetivos se debe fortalecer en los países de la región en donde ya existe, e
introducir en aquellos en donde aún no se han puesto en marcha evaluaciones que dife-
rencien claramente esta dupla de objetivos. Más aún: sería deseable que las evaluaciones
docentes obligatorias y periódicas se encaminaran a detectar las principales debilidades
pedagógicas y disciplinares de los maestros, y a superarlas a través de la capacitación y
formación continua. De manera complementaria, se deberían llevar adelante evaluacio-
nes cuyos resultados se aten a ascensos, bonificaciones o incluso remoción de las aulas
en caso de ser necesario. Estas se podrían realizar con menor periodicidad y con la uti-
lización de otros instrumentos complementarios que evalúen aspectos adicionales del
desempeño docente.
CINCO CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA 97
Tercero, sin importar el tipo de evaluación que los formuladores de políticas busquen
implementar —de ingreso, de período de prueba, periódica obligatoria o de ascenso o
bonificaciones—, para que las evaluaciones en realidad capturen la efectividad de los
docentes, se debe asegurar que su diseño e implementación otorgue resultados confia-
bles y válidos. Es decir, que deben reflejar de manera consistente aspectos exclusivamente
relacionados con las prácticas docentes y no estar sujetas a otros factores (por ejemplo,
no deben depender de quién es el evaluador o del día en que se hace la evaluación), y
que deben estar altamente correlacionadas con los aprendizajes de los estudiantes y el
desempeño estudiantil. Estas características son indispensables para que la evaluación
docente pueda otorgar información útil y relevante a los docentes y al sistema educativo
en general, y para que constituya una medida aceptada por los docentes como un buen
indicador de su desempeño. La complejidad de la labor docente implica a su vez que una
evaluación válida y confiable cuente con el uso de una multiplicidad de instrumentos que
permitan capturar algunas de las numerosas tareas que ejercen los docentes en las aulas.
Estas tareas incluyen, entre otras cosas, la promoción efectiva de las habilidades cognitivas
y socioemocionales de los estudiantes (véanse, por ejemplo, Jackson, 2018 y Kraft, 2019).
La evidencia de uno de los proyectos más completos en el área (MET, 2013) sugiere que
una combinación de tres instrumentos —observaciones estandarizadas en el aula, medidas
de valor agregado en base a exámenes estandarizados de los estudiantes, y encuestas a
los propios estudiantes— puede resultar efectiva para detectar maestros sobresalientes en
la promoción de los aprendizajes de los estudiantes en Estados Unidos. El uso de estos ins-
trumentos, así como el peso que puedan tener en la evaluación dependerán, entre otras
cosas, del objetivo principal que esta última persiga, de los estándares de enseñanza que
existan en cada país, del estado de la política docente, de la calidad de la formación inicial
y en servicio, y del presupuesto disponible para llevar a cabo las evaluaciones. Además,
como lo han demostrado algunos estudios sobre el tema (Sartain y Steinberg, 2015; Ste-
cher et al., 2018), la calidad de la implementación de los instrumentos finalmente escogidos
es también fundamental y determinará la posibilidad de que en efecto se alcancen los obje-
tivos esperados de los sistemas de evaluación.
Para lograr que la evaluación docente otorgue resultados válidos y confiables, la elec-
ción de los instrumentos usados para medir la efectividad es esencial. Al respecto, vale la
pena destacar algunos aprendizajes relacionados con el uso y el diseño de cuatro de los
instrumentos más comúnmente considerados para medir la efectividad de los docentes
en promover el desarrollo de las habilidades de sus estudiantes: medidas de valor agre-
gado docente, rúbricas de observación en clase, portafolios docentes y exámenes de
conocimiento disciplinar.
Con respecto a las medidas de valor agregado docente —las cuales se basan en los
resultados de múltiples evaluaciones estandarizadas de estudiantes, generalmente admi-
nistradas al principio y al final de un grado o año escolar—, la evidencia sugiere que, aunque
son adecuadas para identificar quiénes son los maestros más (o menos) efectivos, resultan
98 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
y Taut, 2016). Estas permitirán identificar las falencias más básicas en el desempeño del
docente y aquellas urgentes de superar, y posibilitarán en el tiempo la utilización de rúbri-
cas más completas. Si, por el contrario, lo que se decide es la observación de prácticas a
través de videos, sería relativamente más sencillo implementar rúbricas más completas,
que midan aspectos adicionales de la labor docente. Sin embargo, es fundamental definir
cómo se realizarían los videos, quién lo haría, y si serían responsabilidad del propio docente
o de personas externas a la escuela.
El uso de portafolios docentes que incentivan al maestro para que lleve a cabo pro-
cesos de autorreflexión y permiten la recolección de evidencia directa en cuanto a cómo
planifican, aplican y evalúan los conocimientos en su área, ha demostrado ser valioso tanto
en el contexto latinoamericano como en países desarrollados. De hecho, esta herramienta
ya está siendo utilizada en Chile y Honduras, países de cuya experiencia se pueden des-
prender aprendizajes importantes en cuanto a su estructura e implementación. Además,
se trata de una herramienta alternativa que permite identificar algunas de las habilidades
pedagógicas en sistemas con un gran número de docentes, con características geográ-
ficas difíciles, o con restricciones presupuestarias, que hacen que sea complicado llevar
adelante una evaluación censal usando un instrumento de observación en el aula. Por
supuesto, como todos los instrumentos de evaluación, su implementación es fundamen-
tal. Por ejemplo, la calificación de dichos portafolios debe quedar en manos de personal
capacitado, y para que esta calificación no se produzca de manera subjetiva, debe contar
con criterios objetivos, claros y sistemáticos. De la misma forma, se debe garantizar que
no exista la posibilidad de creación de “mercados” para la elaboración de estos portafolios
por alguien distinto al mismo maestro, y que sean verdaderamente el resultado del trabajo
de reflexión de cada docente.
Las evaluaciones docentes también podrían incluir exámenes disciplinares que per-
mitan determinar cuál es el nivel de conocimientos que cada maestro tiene en su área
específica. Al centrarse en las habilidades y saberes pedagógicos, algunos de los instru-
mentos arriba referenciados no permiten identificar falencias en este aspecto fundamental
de la docencia. Evaluar el conocimiento disciplinar de los docentes es relativamente menos
complicado y costoso que evaluar habilidades pedagógicas. Pero, como toda política
docente, su diseño e implementación no son triviales, y se requiere el desarrollo de exá-
menes de conocimientos que concuerden con los objetivos de aprendizaje de cada área y
grado escolar en el sistema.
Estos exámenes disciplinares deberían incluirse como parte de los diferentes tipos de
evaluación docente. Primero, como parte de los exámenes de ingreso a la carrera docente,
para que aseguren que solo puedan ingresar y ejercer la profesión aquellos individuos con
un cierto nivel de conocimientos. La pérdida del prestigio de la profesión, documentada
por Elacqua et al. (2018), se explica en parte por la disminución de la calidad de la forma-
ción inicial, lo que a su vez trae implicaciones en cuanto al nivel de conocimiento disciplinar
de los docentes. Por ello, también es necesario mejorar la calidad de los programas de
100 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
La cuarta clave para una evaluación docente exitosa es que los resultados que surjan de
estas evaluaciones deben ser utilizados en la toma de decisiones laborales y de forma-
ción continua de los maestros. Es indispensable hacer un uso efectivo y adecuado de la
información proveniente de los resultados, ya que solo a través de verdaderas transforma-
ciones en la capacitación continua y en la composición de la fuerza docente será posible
mejorar la calidad de la enseñanza y los aprendizajes de manera sistémica. Si el objetivo
principal del sistema de evaluación es la mejora del conocimiento pedagógico y/o disci-
plinar del docente, la evaluación debe venir acompañada de programas de formación en
servicio que respondan de manera directa a las debilidades que las evaluaciones reflejen.
En la región, tan solo las regulaciones de Chile y Perú atan los resultados de las evalua-
ciones obligatorias periódicas a este tipo de programas. Aunque se han llevado a cabo
algunas iniciativas destacadas aún falta mucho camino por recorrer en este aspecto en la
región (Cortés et al., 2011; Schmelkes, 2017). La planificación y puesta en marcha de este
tipo de programas también son complejas y costosas, y demandan inversiones elevadas en
tiempo y dinero, factores que podrían explicar los escasos avances que ha tenido la región
en este frente. Sin embargo, queda claro que solo a través de este tipo de programas será
posible mejorar las capacidades de la fuerza docente en los países de América Latina y
el Caribe.
El uso de la información para otorgar incentivos laborales tampoco es sencillo y el
diseño de un sistema de bonificaciones, ascensos o despidos dentro de la carrera debe ser
cuidadoso para no llevar a incentivos perversos. Por ejemplo, al aportar información de
aquellos maestros más o menos efectivos, las medidas de valor agregado pueden ser utili-
zadas para generar cambios en la composición de la fuerza docente a través de la remoción
CINCO CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA 101
Aaronson, D., L. Barrow y W. Sander. 2007. Teachers and Students Achievement in the
Chicago Public High Schools. Journal of Labor Economics, 25(1): 95–135.
Adnot, M., T. Dee, V. Katz y J. Wyckoff. 2017. Teacher Turnover, Teacher Quality, and Stu-
dent Achievement in DCPS. Educational Evaluation and Policy Analysis, 39(1): 54–76.
Aparecido Cordão, F. 2012. Carreira docente: análise jurídica e institucional. Trabajo encar-
gado por el BID. (Documento sin publicar).
Araujo, M. C., P. Carneiro, Y. Cruz-Aguayo y N. Schady. 2016. Teacher Quality and Learning
Outcomes in Kindergarten. The Quarterly Journal of Economics, 131 (3): 1415–53.
Banco Mundial. 2017. Indicadores del Desarrollo Mundial. Washington, D.C.: Banco Mundial.
———. 2018. World Development Report 2018: Learning to Realize Education’s Promise.
Washington, D.C.: Banco Mundial.
Banerjee, Abhijit Vinayak, Shawn Cole, Esther Duflo, and Leigh Linden. 2007. Remedying
Education: Evidence from Two Randomized Experiments in India. Quarterly Journal of
Economics 122 (3): 1235–64.
103
104 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
Banuri, S., P. Keefer y D. de Walque. 2018. Love the Job... or the Patient? Task vs.
Mission-Based Motivations in Health Care. Documento de trabajo Núm. 8338. Wash-
ington, D.C.: Banco Mundial.
Bruns, B. y J. Luque. 2015. Great Teachers: How to Raise Student Learning in Latin America
and the Caribbean. Washington, D.C.: Banco Mundial.
Bruns, B., I. H. Macdonald y B.R. Schneider. 2019. The politics of quality reforms and the
challenges for SDGs in education. World Development, Elsevier, Vol. 118(C): 27–38.
Brutti, Z. y F. Sánchez. 2017. Does Better Teacher Selection Lead to Better Students?
Evidence from a Large-Scale Reform in Colombia. Documento CEDE Núm. 015350.
Bogotá: Universidad de los Andes.
Busso, M., J. Cristiá, D. Hincapié, J. Messina y L. Ripani. 2017. Aprender mejor: políticas
públicas para el desarrollo de habilidades. Serie Desarrollo en las Américas. Washing-
ton, D.C.: BID.
Campbell, D. 1979. Assessing the impact of planned social change. Evaluation and Program
Planning, 2(1): 67–90.
Caraballo, D., A. García, M. E. Báez y F. Vargas. 2014. Estado de Situación de las Políticas
Docentes en República Dominicana. Documento de trabajo PREAL/EDUCA.
Chetty, R., J. N. Friedman y J. E. Rockoff. 2014a. Measuring the Impacts of Teachers I: Eval-
uating Bias in Teacher Value-Added Estimates. American Economic Review, 104(9),
2593–2632. Disponible en: https://doi.org/10.1257/aer.104.9.2593.
———. 2014b. Measuring the Impacts of Teachers II: Teacher Value-Added and Student
Outcomes in Adulthood. American Economic Review, 104(9), 2633–79. Disponible
en: https://doi.org/10.1257/aer.104.9.2633.
Chingos, M. M. y P. E. Peterson. 2011. It’s Easier to Pick a Good Teacher than to Train One:
Familiar and New Results on the Correlates of Teacher Effectiveness. Economics of
Education Review, 30 (3): 449–65.
CUREE (Centre for the Use of Research and Evidence in Education). 2018. International
Review of Teacher Evaluation Systems: Technical Report and Comparative Analysis.
Coventry: CUREE. Documento de antecedentes preparado para el proyecto del BID
“Measuring teacher effectiveness in Latin America”, 2017–18.
Elacqua, G., D. Hincapié, E. Vegas y M. Alfonso. 2018. Profesión: Profesor en América Latina.
¿Por qué se perdió el prestigio docente y cómo recuperarlo? Washington, D.C.: BID.
Estrada, 2019. Rules versus Discretion in Public Service: Teacher Hiring in Mexico. Journal
of Labor Economics, 37(2), 545-579.
106 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
FEREMA (2015). Honduras el Estado de las Políticas Públicas Docentes. Tegucigalpa: Infor-
mes de Seguimiento PREAL.
Fryer, R. 2013. Teacher Incentives and Students Achievement: Evidence from New York City
Public Schools. Journal of Labor Economics, 31(2): 373–427.
Hanushek, E. A., J. F. Kain, D. M. O’Brien y S. G. Rivkin. 2005. The Market for Teacher Qual-
ity. Documento de trabajo del NBER Núm. 11154. Cambridge, MA: National Bureau of
Economic Research.
Ingersoll, R. M. y M. Strong. 2011. The Impact of Induction and Mentoring Programs for
Beginning Teachers: A Critical Review of the Research. Review of Educational Research,
81 (2): 201–233.
Jackson, C. K. 2018. What Do Test Scores Miss? The Importance of Teacher Effects on Non–
Test Score Outcomes. Journal of Political Economy, 126, Núm. 5 (octubre): 2072–2107.
Kane, T., K. Kerr y R. Pianta. 2014. Designing teacher evaluation systems: New guidance
from the measures of effective teaching project. Hoboken, NJ: John Wiley & Sons.
Kraft, M. A. 2019. Teacher effects on complex cognitive skills and social-emotional compe-
tencies. Journal of Human Resources, 54(1): 1–36.
Kremer, M., C. Brannen y R. Glennerster. 2013. The challenge of education and learning in
the developing world. Science, 340(6130): 297–300.
Lachlan-Haché, L., L. Matlach, A. Guiden y M. Castro. 2015. What We Know About SLOs: An
Annotated Bibliography of Research on and Evaluations of Student Learning Objec-
tives. Washington, D.C.: American Institutes for Research.
Lai, F., L. Zhang, Q. Qinghe, X. Hu, Y. Shi, M. Boswell y S. Rozelle. 2012. Does Computer-Assisted
Learning Improve Learning Outcomes? Evidence from a Randomized Experiment in
Public Schools in Rural Minority Areas in Qinghai, China. Documento de trabajo REAP
Núm. 237, Rural Education Action Program, Freeman Spogli Institute. Stanford, CA:
Stanford University.
108 PROFESORES A PRUEBA: CLAVES PARA UNA EVALUACIÓN DOCENTE EXITOSA
MET. 2013. Ensuring Fair and Reliable Measures of Effective Teaching: Culminating Findings
from the MET Project’s Three-Year Study. Policy and Practice Brief. Seattle: MET Proj-
ect, Bill & Melinda Gates Foundation.
———. 2019. Promoting quality education in Chile: the politics of reforming teacher careers.
Journal of Education Policy, DOI: 10.1080/02680939.2019.1585577.
Molina, E. et al. 2018. Measuring Teaching Practices at Scale: Results from the Development
and Validation of the Teach Classroom Observation Tool. Documento de trabajo de
investigación de políticas Núm. 8653. Washington, D.C.: Banco Mundial.
Näslund, E., H. Alonzo y D. Martin. 2013. Challenges and Opportunities in the Belize Educa-
tion Sector. Nota técnica Núm. IDB-TN-538. Washington, D.C.: BID.
Nogueira, D. X. P., G. Ribeiro de Jesus y S. Pereira da Silva Cruz. 2013. Avaliação de desem-
penho docente no Brasil: desvelando concepções e tendencias. Linhas Críticas, Brasília,
DF, v. 19, n. 38, pp. 13–32.
———. 2013. Teachers for the 21st Century: Using Evaluation to Improve Teaching. París: OCDE.
———. 2015. Who Wants to Become a Teacher? PISA in Focus 58. París: OCDE.
———. 2016. Reviews of School Resources: Uruguay 2016. OECD Reviews of School
Resources. París: OCDE.
———. 2017. Education in Costa Rica, Reviews of National Policies for Education. París: OCDE.
Ome, A. 2012. The Effects of Meritocracy for Teachers in Colombia. Informe de investiga-
ción Núm. 010260. Bogotá: Fedesarrollo.
Papay, J. P. 2011. Different Tests, Different Answers the Stability of Teacher Value-Added
Estimates across Outcome Measures. American Educational Research Journal,
48: 163–193.
Papay, J., Taylor, E. S., Tyler, J. y M. Laski. 2016. Learning Job Skills from Colleagues
at Work: Evidence from a Field Experiment Using Teacher Performance Data. Doc-
umento de trabajo del NBER Núm. 21986. Cambridge, MA: National Bureau of
Economic Research.
Polikoff, M. S. 2015. The Stability of Observational and Student Survey Measures of Teach-
ing Effectiveness. American Journal of Education, 121(2): 183–212.
Rockoff, J. E., D. O. Staiger, T. J. Kane y E. S. Taylor. 2012. Information and Employee Evalu-
ation: Evidence from a Randomized Intervention in Public Schools. American Economic
Review 2012, 102(7): 3184–3213.
Schleicher, A. 2016. Teaching excellence through professional learning and policy reform.
Lessons from Around the World, International Summit on the Teaching Profession.
Smith, W. C. y K. Kubacka. 2017. The emphasis of student test scores in teacher appraisal
systems. Education Policy Analysis Archives, 25.
Stallings, J. y S. Knight. 2003. Using the Stallings Observation System to Investigate Time
on Task in Four Countries. Documento no publicado preparado para el proyecto Inter-
national Time on Task (ITOT). Washington, D.C.: Banco Mundial.
REFERENCIAS BIBLIOGRÁFICAS 111
Steele, J., M. Pepper, M. Springer y J. R. Lockwood. 2015. The distribution and mobility of
effective teachers: Evidence from a large, urban school district. Economics of Education
Review, 48(2015): 86–101.
Sun, Yulan F. 2017. “La evaluación Docente en Chile: Trayectorias y Aprendizajes”. Presen-
tación en el Centro de Medición MIDE.
Wyckoff, J. y V. Katz. 2018. Review of Teacher Evaluation Systems in the United States:
Technical Report and Comparative Analysis. Documento de antecedentes preparado
para el proyecto del BID “Measuring teacher effectiveness in Latin America”, 2017–18.
La evaluación docente es un instrumento fundamental para apoyar el
desarrollo profesional de los maestros y mejorar la efectividad de la
enseñanza. Este estudio analiza las evaluaciones docentes en América
Latina y el Caribe y en varios sistemas educativos de buen desempeño de
otras regiones, y presenta orientaciones prácticas sobre cómo desarrollar
evaluaciones docentes exitosas.
Existen cinco claves para una evaluación docente exitosa. Primero, definir
qué es lo que se espera de un docente de excelencia. Segundo, precisar
cuál es el objetivo que busca alcanzar la evaluación docente. Tercero,
producir resultados confiables y válidos. Cuarto, usar de manera eficiente
los resultados según los objetivos establecidos. Quinto, realizar una
investigación continua de los procesos y resultados para retroalimentar
el sistema de evaluación.
ISBN 978-1-59782-369-2
90000
9 781597 823692