Daniel Feldman - Evaluación de La Enseñanza y El Aprendizaje

Evaluación de la enseñanza y el aprendizaje
01-006-104
Daniel Feldman
Índice
Presentación
26 Copias
¿Para qué cree usted que está la enseñanza?
La evaluación como parte de la acción
Tipos funcionales de evaluación
La evaluación formativa: evaluar para enseñar, evaluar para aprender
Al final, ¿a qué cosa se llama “evaluar”?
Los instrumentos para obtener información
Los criterios para valorar
La calificación
Posibles sesgos en la evaluación
Relaciones entre programación, enseñanza y evaluación
¿Qué hacer con las prácticas de evaluación?
Bibliografía
Presentación
La evaluación puede ser tratada en diversas escalas. Algunas de las discusiones
que hoy resultan más álgidas están relacionadas con la existencia de grandes
sistemas de evaluación. Esto puede entenderse si se tiene en cuenta el impacto
político, social y financiero de las evaluaciones estandarizadas y generalizadas. En
algunos países, esas evaluaciones actúan como indicador de la eficacia de la
inversión en educación. Los establecimientos pueden ser rankeados y el sistema
educativo es ponderado según los resultados que obtienen los alumnos. Esta
importancia dada a la evaluación estandarizada suele coincidir con la aceptación de
prácticas institucionalizadas de selección y clasificación de recorridos educativos. La
evaluación estandarizada adquiere cada vez más importancia, inclusive en un país
como la Argentina, que no desarrolló una particular cultura de evaluación
educativa, en comparación con otros países, como Inglaterra, los Estados Unidos y
Francia.
Muchas cosas pueden ser evaluadas en las actividades educativas: el aprendizaje
de los alumnos, los dispositivos, los métodos o las técnicas de enseñanza, el plan
de estudios, materiales, programas o proyectos, los rendimientos cuantitativos de
un sistema, la tarea de los profesores, la calidad de la gestión institucional. Esas
cosas pueden ser evaluadas con distintos propósitos, por distintas personas y
mediante diferentes métodos.
En el siguiente cuadro, estructurado en torno de las preguntas por qué, qué y cómo
evaluar, así como quién evalúa, Jean-Marie De Ketele (1984) sintetiza rasgos
diferenciales de la evaluación:
1/26
¿Quién evalúa?
Auto-evaluación
● Subordinados
● Iguales
● Autoridades
Hétero-evaluación internas
● Personas
independientes
● Autoridades ¿Qué? (sujeto-objeto)

externas
● Certificar (objetivos terminales globales) ● Alumnos ● Enseñanza ● Objetivos ● Técnicas ● Materiales ● Métodos...
● Clasificar en el interior de una población ● Examen escrito

(objetivos de perfeccionamiento)
Evaluación clásica puntual
● Hacer un balance (objetivos intermedios) ● Entrevista libre (oral clásica)
empírica
● Diagnosticar (errores, producto, proceso) ● Test centrado en los objetivos
● Clasificar en subgrupos ● Entrevista centrada en los objetivos Evaluación puntual centrada

● Seleccionar ● Análisis de contenido en los objetivos
● Predecir el éxito ● Observación libre
● Descubrir factores ● Observación sistemática Evaluación durante el proceso

● Orientar (prevenir) ● Observación provocada
¿Por qué? (función: decisión a ¿Cómo? (técnica)

tomar)
2/26
Aquí, se tratará la evaluación desde un punto de vista más bien restrictivo. Se
priorizará la reflexión sobre la evaluación del aprendizaje en la sala de clases. No
quiere decir que no aparezcan cruzadas las demás dimensiones, sino que el lector
notará que, en general, se estará enfocando el tema desde la mirada del que
enseña.
La evaluación siempre fue un tema delicado, ligado con ideas de control y de
selección. En ella se expresa el ejercicio de la autoridad de la escuela y del profesor
y, mirando desde el otro lado, la presión que reciben los alumnos. La evaluación
revela la asimetría del dispositivo escolar y muestra su carácter, muchas veces
arbitrario.
La evaluación tiene, además, varios usos non sanctos, alejados de su función
originaria. Se la usa, por ejemplo, para imponer ritmo de trabajo, mantener el
orden, sancionar o mostrar “quién manda”.
Para el profesor, la evaluación tampoco suele ser uno de los momentos más
gratos de la tarea. Indudablemente, los alumnos no lo ven así; sin embargo,
cualquiera con experiencia en la enseñanza formal recuerda la fatiga de las largas
correcciones, el cansancio de leer, una y otra vez, versiones de lo mismo, la
dificultad de avanzar en textos no siempre claros y de indicar a cada uno lo
necesario, de ponderar los aciertos y los errores a la hora de calificar, de procurar
que las notas correspondan al nivel de producción y de no cometer demasiadas
arbitrariedades.
Desde el punto de vista de la vida cotidiana en las aulas y en las escuelas, la
evaluación, salvo raras excepciones, no es el gran momento de la educación ni para
los profesores ni para los alumnos. Incluso, pocas pedagogías asientan la nobleza
de sus propósitos en la dimensión evaluativa.
Dicho todo lo cual, no tendríamos más que remover tan odioso elemento,
clarificar las relaciones escolares y permitir que profesores y alumnos vivan en un
mundo de serena felicidad y comunión. ¿Está usted dispuesto a proponer tal cosa?
No será el primero al que se le ocurra ni estará solo en el intento. Tampoco dejará
de tener opiniones en contrario ni de ser severamente criticado ¿Dirá usted, acaso,
que podemos retirar, sin más, la evaluación de las prácticas educativas
sistemáticas? ¿Cualquier resultado le daría a usted igual? ¿Está proponiendo que
firmemos un millonario cheque en blanco y que suceda lo que suceda?
El problema es buscar algún punto a partir del cual tratar la cuestión sin caer
en demasiados prejuicios.
Digo “‘demasiados’ prejuicios”, porque es imposible abordar estos temas sin
imágenes y construcciones previas: todos tenemos una valoración positiva o
negativa de la evaluación. ¿Cuáles son las suyas? ¿Con qué tiene asociada la idea
de evaluar?
Desde ahora le adelanto que mi visión no es imparcial y equidistante. No pienso
hacer aquí un repaso de argumentos –aunque me parece una tarea muy valorable-.
Probablemente porque me dedico a la didáctica, consideraré la evaluación como
una variable importante de las actividades de enseñanza. Ya conoce mi opinión.
Debería dar las razones ahora. Allí vamos. Mi punto de partida es una pregunta:
¿Para qué cree usted que está la enseñanza?

Propondré algunas posibles respuestas de las que puede haber en circulación:
para que los alumnos obtengan determinados aprendizajes, desarrollen ciertas
capacidades, adquieran ciertos modos de apreciar o de valorar. Solemos expresar
este tipo de intenciones en planes de estudio y en programas. Asumimos, en
3/26
general, que el mundo adulto tiene algún derecho para decidir cosas que los
jóvenes deberán adquirir para su ingreso en la sociedad.
Éste no es sólo un problema de las escuelas. Toda sociedad conocida estableció
conocimientos, destrezas y disposiciones que los jóvenes debían adquirir durante su
preparación para, luego, formar parte del mundo adulto. Nuestra sociedad realiza
esta preparación en sistemas de gran tamaño. Esto ocurre debido a la complejidad
de nuestra vida, al cúmulo enorme de conocimiento y tecnologías disponibles y a la
cantidad creciente de personas que se incorporan a la vida adulta a partir de esa
preparación especializada.
La expresión de nuestras intenciones educativas tiene un sencillo correlato. Si
esto es lo que pretendemos ¿en qué medida lo estamos logrando? Pregúntelo de
otra manera: ¿deberíamos tener algún medio al alcance para saber si las
importantes intenciones educativas de las escuelas son realizadas? Si se considera
que estas intenciones educativas están directamente ligadas con el desarrollo del
mundo en que vivimos y que no resultan accidentales, sino centrales para su
existencia y mejora, parece casi inevitable dar una respuesta positiva. Tendríamos
así un primer motivo: las acciones de enseñanza tienen tal importancia social que el
hecho de evaluar está vinculado a la importancia otorgada. Pero no es el único
motivo.
Podemos tomar las intenciones educativas y considerarlas, ahora, en una
escala más cercana: la de la tarea en la sala de clases. Todo profesor planifica
ciertas realizaciones. Organiza un sistema para que los alumnos puedan producir
algo: resolver una tarea, analizar un problema, organizar información, diseñar un
proyecto, comprobar una idea, debatir un conflicto, establecer relación entre dos
series de hechos, comparar casos para buscar elementos comunes, conocer una
teoría, inventar un concepto, obtener datos de libros o material informativo,
organizar un grupo pequeño, realizar obras en diferentes lenguajes. La lista puede
continuar. En cualquier concepción constructivista se aceptará que estas actividades
y producciones permiten, dicho en términos muy generales, que los alumnos
“aprendan algo”.
Tanto desde el punto de vista del profesor como desde el del alumno, es
necesario tener algún conocimiento acerca de la eficacia, el éxito o la pertinencia de
las actividades emprendidas. Como sucede en cualquier proceso de producción. En
el caso del profesor, para organizar su intervención, planificar los cambios y
modular la ayuda que preste. En el caso de la integración del sistema, para
asegurarse el cumplimiento de requisitos que el propio sistema de enseñanza fija y
que permiten el paso de los alumnos en los distintos niveles. En el caso de los
alumnos, es necesario porque el conocimiento acerca de la pertinencia y la
dirección de los propios esfuerzos es un elemento de enorme importancia para
mantener la tarea en marcha y realizar las adecuaciones necesarias.
Desde este punto de vista, las actividades de aprendizaje y las de enseñanza
forman parte de acciones productivas. Suelen, en la mayoría de los casos, tener
propósitos bastante definidos y parte de sus resultados puede ser prevista. Si, a
veces, no puede ser previsto el contenido de ese resultado (en el caso de una
investigación, un trabajo artístico o un debate) sí pueden ser establecidos los
criterios mediante los cuales puede ser analizado, juzgado y a partir de los cuales
pueden tomarse decisiones a futuro: podría ser que las conclusiones deban ser
revisadas, o que la información no sea suficiente para apoyar el análisis, o que los
argumentos utilizados no se consideren válidos o que la solución adoptada no
contemple todos los intereses comprometidos. Podría decirse, en resumen, que el
resultado puede ser previsto o que los criterios para analizarlo pueden serlo. En
definitiva, que contamos con algún medio para evaluar las actividades
emprendidas.
4/26
La evaluación como parte de la acción
“¿‘Evaluar’ dijo? ¿Ya volvemos con lo mismo?”, estarán pensando los de la
posición crítica. Acepto que sí. Pero advierta que amplié el contexto. Estoy
considerando la evaluación como un elemento integrante de la acción. Si no, piense
cuando decimos: “Ese actuó a tontas y a locas”, “Se mandó un acting” (si nos
ponemos más técnicos y sofisticados) o “No aprende más: siempre repite lo
mismo”. ¿No está en todo esto la idea de que las acciones presentes y pasadas no
son suficientemente ponderadas para poder tomar mejores decisiones en relación
con las acciones futuras?
La consideración del resultado de nuestras acciones forma parte integrante de
la propia acción. Es el elemento que nos permite darles dirección y, si se permite el
término, eficacia.
Entre los pedagogos la idea de eficacia quedó muy relacionada con algunas
tendencias pedagógicas, más bien vinculadas a lo que se conoce como “tecnología
instruccional”, que, en nuestros pagos, es identificado como “tecnicismo”. Dicho
rápidamente, a mucha gente no le gusta que le hablen de eficacia. Le resulta un
concepto poco educativo. Yo no estoy muy seguro de que sea así. Los seres
humanos procuramos y necesitamos conducir con eficacia nuestras acciones,
simplemente, porque somos seres intencionales. Llamamos “competente” al que
sabe conseguir o resolver los problemas que enfrenta de una manera adecuada y
con una inversión razonable de recursos, energía y tiempo. O sea, al que los
resuelve con eficacia.
Los criterios para juzgar los logros de una acción nos permiten ponderarla en
función de su capacidad de lograr lo que se proponía: la preparación de una buena
cena, el arreglo de la pared, el permiso para ir al campamento, el consentimiento
para una cita, la aceptación de una monografía, el desarrollo de ciertas habilidades
por parte de los alumnos a cargo o lo que sea.
Por supuesto, hablar de eficacia siempre requiere algún criterio o parámetro
sobre la base del cual juzgar los logros de la acción. Esos parámetros pueden
perfectamente ser debatidos y acordados. Pueden ser establecidos por el propio
sujeto, en acuerdo con otros, o aceptados de otras fuentes a las que se les
reconoce legitimidad. En cualquier caso, una vez establecidos, nos ofrecen una
manera de juzgar nuestras acciones y las de otros.
Gran parte de nuestra vida consiste en producir, lograr cosas o alcanzar ciertas
metas. Evaluamos nuestras acciones, entonces, para juzgar su capacidad de
alcanzar las metas propuestas y, de manera muy importante, evaluamos nuestros
desempeños para poder dirigir, modificar o mantener nuestros esfuerzos o, en caso
necesario, para volver a planificarlos. Somos, por esencia, evaluadores: mientras
actuamos, obtenemos información, la comparamos con algunos criterios
establecidos, vamos juzgando y tomamos decisiones en consecuencia. Evaluar es
comparable al hecho de fijar nuestra posición en el mapa, cotejarla con la hoja de
ruta y definir los próximos pasos a tomar.
Si lo miramos de esa manera, ¿evaluar sigue siendo un terrible evento
educativo? “Bueno”, me dirá. “Está presentando la cara linda. Me viene usted con el
argumento de las funciones y su lugar en las acciones intencionales, y suerte que
no me echó encima las teorías cognitivas con todos los mecanismos de planificación
y regulación de la acción. Pero ¿no se está olvidando usted de las calificaciones y de
las aprobaciones y de las desaprobaciones y de las promociones y de las
repeticiones y de todo eso?”
No, no me olvido. Pero tengo mi argumento preparado, como se podrá
imaginar. ¿Acaso no estábamos conversando sobre evaluación?
5/26
“Oiga”, pensará, “se conversa entre muchos y yo estaba aquí, lo más tranquilo,
y usted me vino con todo el fárrago ese de la evaluación”.
Bueno, concedido, yo traje el tema. Pero, no me dirá usted que es un tema sin
importancia. Hasta los niños de primer grado hablan ahora del asunto. Pero ésa no
es la cuestión. Le quería decir yo que, si estábamos hablando de evaluación, no
veía por qué comenzaba a disparar con esa cuestión de exámenes, notas y
reprobados.
“¿Me está tomado el pelo? ¿No es lo que se hace con la evaluación?”
Ahora veo por dónde va. Esa es una de las cosas que se hacen. Pero está lejos
de ser la única. Técnicamente llamamos a eso “función de certificación”. Si toma en
cuenta lo que expliqué hasta ahora, verá que la evaluación tiene como función
principal permitir la toma fundamentada de decisiones. Para eso, se recurre a
información, lo más sistemática posible, y se realizan ponderaciones o juicios
basados en criterios. Una decisión posible puede ser calificar, aprobar o certificar el
cumplimiento de requisitos. Pero otras decisiones, no menos importantes, pueden
consistir en el ajuste de la planificación, la ubicación del grupo antes de comenzar
un curso o la dirección de la actividad de alumnos y profesores durante la tarea. Se
suele llamar a la primera función “diagnóstica” y, a la segunda, “formativa” o “de
regulación”.
Como verá, puede ser que buena parte del problema que aparece con la
evaluación tenga que ver con que el término quedó ligado a una de sus funciones y
con algunos de sus métodos posibles. Vamos a ampliar esa cuestión.
Tipos funcionales de evaluación

Permítame una brevísima referencia histórica. El inicio del siglo XX marcó en
educación, como en otras áreas, una fuerte impronta de los enfoques científicos,
asociados, en ese momento, con la medición y la administración racional sobre la
base del modelo industrial imperante. El desarrollo de metodologías de medición
social ofreció los instrumentos que primarán para el análisis del aprendizaje. Se
supone que el rendimiento escolar puede y debe ser medido. Amiguens y Zerbato-
Poudou (1999, p. 173) lo denominan “el período de testing”.
Después veremos algunas cuestiones relacionadas con la medición. El hecho es
que, hacia los años cincuenta, se propone una concepción diferente: la evaluación
comienza a ser entendida, básicamente, como la operación continua de comparar el
estado de avance de los alumnos en relación con los objetivos educacionales
convenientemente operativizados. Esta manera de entender las cosas, basada en la
obra de Ralph Tyler1, para quien que la evaluación debía ser un proceso que
condujera a determinar hasta que punto se habían alcanzado los objetivos
educativos, marcó el modo más generalizado de considerar la evaluación hasta la
fecha.
1
Ralph Tyler fue un educador norteamericano de enorme influencia en el pensamiento
educativo de la segunda mitad del siglo XX. Estableció las bases conceptuales para los
modelos de planificación dominantes durante los años 1960 y 1970. Parte de la capacidad de
difusión de su planteo residió en su carácter de mediación y síntesis entre las ideas de los
progresistas y de los eficientistas. Además, su trabajo ofreció un lenguaje claro y práctico,
basado en un esquema de pensamiento razonable y plausible para los profesores y gestores
educativos. Su libro Principios básicos para la elaboración del currículum, publicado por
primera vez en 1949, tuvo un enorme éxito, aunque años después fue duramente atacado
por los reconceptualistas críticos de los setenta. Tyler nunca respondió a las críticas,
argumentando que el propósito de su trabajo era práctico y que solo discutiría con
alternativas prácticas diferentes de la suya.
6/26
Hacia los años sesenta, comenzaron a reelaborarse, sofisticarse y, en algunos
casos, criticarse las ideas de evaluación como comparación con objetivos. Se
incorporaron nuevas e importantes ideas sobre tipos y funciones de la evaluación.
En ese punto nos quedamos en el apartado anterior y a él quiero volver.
Lo que aparece en esos años es la distinción entre tipos de evaluación, entre lo
que se denominó “evaluación sumativa” (o “compendiada”) y “evaluación
formativa”.
Evaluación sumativa Evaluación formativa
Destinada a determinar el resultado total Tiene como propósito mejorar el

y final de un curso. desarrollo de las tareas durante el propio
curso.
Amiguens y Zerbato indican que, para muchos autores, la evaluación formativa

constituía la “parte dinámica de la pedagogía de dominio, desde el momento en que
contribuye activamente para que el mayor número de alumnos logre dominar los
objetivos pedagógicos predeterminados” (Amiguens y Zerbato-Poudou, p.184). La
evaluación compendiada o sumativa es una evaluación de balance al finalizar una
secuencia de enseñanza. Claro que la duración de esa secuencia es variable y
depende del programa educativo que se considere.
La evaluación sumativa puede ser interna o externa:
Evaluación sumativa interna Evaluación sumativa externa
Consiste en actividades de evaluación Es decidida y diseñada por organismos

diseñadas y administradas por el exteriores al establecimiento y la clase
profesor para su clase; es la forma escolar (con independencia de que los
habitual de evaluación (pruebas o administre el profesor); los operativos
exámenes al finalizar una unidad o un nacionales de evaluación de la Argentina
período escolar) son un ejemplo.
En ocasiones, la evaluación sumativa externa tiene carácter certificativo y

permite alcanzar alguna credencial o derecho de acceso a niveles superiores de
estudio (por ejemplo, el General Certificate of Education, O level o A level, en
Inglaterra; el Baccalauréat, en Francia y el vestibular, en el Brasil).
La distinción entre “externo” e “interno” es de la mayor importancia, porque
buena parte de las reflexiones y las críticas sobre el papel de la evaluación en el
proceso escolar provienen de académicos y profesionales que desenvuelven sus
tareas en países que sostienen fuertes sistemas de evaluación externa. Como es
bien sabido, los sistemas de evaluación externa tienen influencia directa en los
procesos de selección y distribución diferencial de la matrícula escolar. Expresan,
por lo tanto, el poder de asignar de modo desigual recursos sociales. Para algunos
críticos, esta asignación desigual legitima la desigualdad estructural de nuestras
sociedades al adjudicarla a categorías, neutrales, de “excelencia”. Además, los
sistemas externos de evaluación tienen un impacto muy apreciable sobre el proceso
y las oportunidades formativas de los alumnos. Esto sucede porque los contenidos y
las enseñanza de las escuelas tiende a acomodarse a los parámetros, requisitos,
exigencias y contenidos de los exámenes externos, con independencia del
currículum vigente.
La evaluación certificativa es la que se suele tener en mente cuando
despotricamos contra la evaluación o cuando se realizan importantes críticas a su
impacto social y al ejercicio arbitrario de poder que, para algunos, representa.
7/26
Todas esas reflexiones pueden ser razonables. Igualmente, parece necesario
reconocer que ésta no deja de ser una función escolarmente necesaria y habrá que
ver cómo arreglarse con ella. Las escuelas, tal como existen, califican y aprueban.
Básicamente, se utiliza la evaluación en el cumplimiento de las siguientes
funciones:
Funciones de la evaluación
● Formativa Regula la acción pedagógica.
● Pronóstica Fundamenta una orientación.
● Diagnóstica Adecua el dispositivo de enseñanza a las capacidades

del grupo o ubica a un grupo o persona según sus
capacidades actuales en el nivel adecuado para un
proceso educativo.
● Sumativa o Realiza un balance final.

compendiada
● Certificativa Incorpora al balance final un sistema de calificaciones y

un régimen de aprobación y promoción que sostiene la
obtención de certificados (de aprobación de un año
escolar, de un curso o nivel o de un título). Es la forma
que mayoritariamente adopta en los sistemas
escolarizados la evaluación sumativa.
● Informativa Provee datos a la comunidad, los padres, organismos

fiscalizadores y demás.
Adaptado de Perrenoud, 1999ª, pp. 56-57.
La evaluación formativa: evaluar para enseñar, evaluar para aprender

De los tipos funcionales de evaluación, la evaluación formativa es la que se
encuentra más estrechamente ligada al desarrollo de las actividades de
aprendizaje.
Dicho sea de paso, notará usted, estimado lector, que utilizo la idea de
“actividades de aprendizaje” más que la de “procesos de aprendizaje”. La razón es
simple: la enseñanza promueve determinado tipo de actividad por parte de los
alumnos. Esas actividades constituyen el factor explicativo del aprendizaje. Los
alumnos aprenden en función de las tareas que desarrollan, más allá de si esas
tareas tienen manifestación conductual evidente, no la tienen o ésta es poco
perceptible. Tal es el caso, por ejemplo, de un grupo de alumnos que sigue con
atención una charla.
Desde este punto de vista, el conjunto de las acciones de enseñanza tiende a
influir sobre las actividades de los alumnos. Digamos que las relaciones entre
enseñanza y aprendizaje, toman, desde esta perspectiva, la forma de relaciones
entre actividades del profesor y actividades de los alumnos. Una de las maneras de
influir sobre las tareas de aprender consiste en ofrecer información y valoración
sobre la marcha de esas tareas. Ese modo de influencia en las actividades de
aprendizaje es la evaluación formativa y su función principal es la regulación.
Desde el punto de vista del constructivismo pedagógico, es, evidentemente, la
evaluación formativa la que ha recibido un mayor grado de atención. Claro que sólo
es posible cumplir esta función cabalmente en el marco de una restricción que vale
8/26
la pena anotar: la evaluación formativa cumple su rol de reguladora del aprendizaje
si se inscribe en el marco de una pedagogía diferenciada. O sea, de una ayuda
pedagógica que se diversifica para adecuarse a la individualidad del proceso de
aprendizaje.
Se puede discutir la escala y el grado de la individualización, pero es
indiscutible el factor personal en la construcción del aprendizaje. También la
existencia de distintos estilos, enfoques o tiempos. Si no se quiere aceptar ninguna
diferencia en la calidad de los abordajes personales para aprender, sí se
reconocerán, al menos, la existencia de diferentes necesidades y ayudas en el
proceso de aprender por parte de distintos individuos. Si, en última instancia, el
aprendizaje es individual, la regulación que promueve la evaluación formativa sólo
puede actuar en la medida que cada aprendiz reciba ayuda adecuada a su
necesidad. Éste es el principio general. La manera de concretarse depende de
multitud de factores.
Por supuesto, hablar de evaluación formativa es una cosa y asociarla con una
pedagogía diferenciada es otra. Las condiciones del trabajo escolar no son,
precisamente, una ayuda en ese sentido. Veamos un poco más esta cuestión.
Perrenoud propone considerar formativa una práctica de evaluación continua, si
el profesor tiene la intención de contribuir con las tareas de aprendizaje en curso y
mejorarlas, cualquiera sea el grado en que diferencie la enseñanza ( Perrenoud,
1999a, p. 78. La cursiva es mía). El carácter formativo de la evaluación queda,
entonces, según Perrenoud, asociado con el propósito de participar en la regulación
del aprendizaje o, dicho más simplemente, de cooperar con los alumnos en sus
actividades de aprendizaje.
Esta cooperación se efectiviza de dos maneras. La primera, adaptando el ritmo
y el tipo de ayuda. La segunda, ofreciendo información a los alumnos acerca de sus
tareas, de sus progresos y de sus dificultades, lo que, en términos sistémicos, se
denominaría “retroalimentación informativa”. La evaluación formativa interviene de
manera constante, y no segmentada, en el aprendizaje. No consiste, sólo, en cortes
evaluativos en el proceso de enseñanza a efectos de utilizar secuencias didácticas
de recuperación o remediales.
Se estableció una relación estrecha entre evaluación formativa e intervención
pedagógica; este par es el que actúa en la regulación del aprendizaje. Pero ¿qué
tipo de intervención pedagógica? Quedó claro que alguna que mantenga una
tendencia de diferenciación sin que esto implique, necesariamente, la
individualización de la enseñanza. En mi opinión, debe entenderse como una
adecuación de la ayuda a necesidades que no serán homogéneas pero tampoco
totalmente diversas.
Bien, una tendencia a adecuar el tipo de ayuda. ¿Eso es todo? Probablemente
sí. Según Perrenoud, lo formativo reside en su capacidad de ayudar a los alumnos a
aprender y no en la modalidad de evaluación (Perrenoud, 1999a, p. 103). Tampoco
cree que se deba asociar con un tipo especial de intervención pedagógica. Se puede
ayudar de muchas maneras a los alumnos y lo que se debe procurar es una
ampliación de las intervenciones.
Al final, ¿a qué cosa se llama “evaluar”?

Ya es tiempo de sistematizar el concepto. Se sostuvo, hace un rato, que la
evaluación era consustancial de toda acción intencional y, por lo tanto, de las
tareas de enseñanza. Desde un punto de vista general, la evaluación forma parte
de cualquier actividad de enseñanza. Forma parte de la pregunta: “¿Cómo van las
cosas? ¿”stán comprendiendo?” O de las reflexiones: “Hoy la clase fue buena, pudo
notarse en el nivel de las preguntas y en la discusión final, pero ¿los que no
9/26
participaron?” O de las preocupaciones: “Creo que debería disminuir el ritmo”, “Me
parece que este tema precisa más ejercitación”, “Hoy noté muchos errores en la
tarea individual”. O de las “calificaciones”: “Marta mejoró mucho en su rendimiento,
se esfuerza y parece más animada, habría que apoyarla un poco más porque, de
seguir así, puede aprobar la materia”. En todos esos casos, y en muchos más, es
posible hablar de “evaluaciones” que cada docente realiza de forma permanente y
de manera informal.
Pero, normalmente, la referencia a la evaluación alude a una dimensión más
formalizada. Nos referimos a evaluación para denominar momentos especiales en
los que el propósito fundamental consiste en realizar “eso”.
Pero, se estará preguntando usted, ¿este sujeto piensa seguir hablando del
tema sin definirlo?
Creo que hasta ahora nos entendíamos bien sin tanta necesidad de andar
definiendo. Pero, ya que me lo reclama, veamos si podemos ponernos de acuerdo
en los siguientes tres rasgos:
Rasgos de la evaluación
● Incluye obtener información del modo más sistemático posible.
● Supone la valoración de un estado de cosas en relación con criterios establecidos,

o sea, supone algún tipo de juicio basado en la información disponible.
● Su propósito es la toma de decisiones.
La evaluación se diferencia de una actividad descriptiva, porque su propósito

principal no reside en la búsqueda y la organización de información. Su propósito
fundamental es la acción posterior. La información, en sí, no es base para la toma
de decisiones. Las decisiones son tomadas sobre la base de los juicios que se
elaboran. Esos juicios o valoraciones se fundamentan en el análisis de la
información disponible con ciertos criterios: objetivos, pautas de desarrollo,
modelos, reglas de procedimiento, principios. En resumen, como señala Perrenoud,
siempre se evalúa para actuar (Perrenoud, 1999a, p. 53). Es necesario considerar
las acciones y decisiones que ella fundamenta y que alcanzan a personas bien
definidas.
Como el propósito de la evaluación es tomar decisiones de distinto nivel, la
información que se utilice, los instrumentos para obtenerla, los criterios y las
pautas de valoración dependen, fundamentalmente, del propósito que se quiera
cumplir o, dicho de otra manera, de la decisión que se quiera tomar. No hay, por lo
tanto, nada de universal en una práctica de evaluación. En primer lugar, porque las
decisiones que se pueden tomar son variables. En segundo lugar, porque, aunque
se pueda establecer una tipología de decisiones posibles cada decisión que
realmente se toma está definida por el contexto en el que se la toma. Por la
situación específica, los puntos de partida reales, los participantes, etcétera. Con
esto se enfatiza que el problema que resuelve cada proceso de evaluación es
singular y requiere una definición propia. Lo mismo sucede, por otra parte, con los
problemas relativos a la planificación o a la enseñanza interactiva.
Jean-Marie De Ketele plantea que, para tomar decisiones pedagógicas, es
importante saber para que se evalúa. Desde esta perspectiva, propone una
tipología de posibles propósitos o funciones de una evaluación o, en otros términos,
un inventario de decisiones pedagógicas al respecto:
Evaluar para certificar: En este caso, se trata de decidir si la persona que
evaluamos posee los conocimientos suficientes para pasar al curso o al ciclo
siguientes, o a la vida profesional, según corresponda. La evaluación debería
10/26
referirse no a micro-objetivos intermedios, sino a objetivos globales terminales, es
decir, a macro-objetivos que integren un número importante de objetivos
intermedios. Como la certificación es una decisión dicotómica –el alumno tiene o no
tiene la competencia mínima–, es fundamental definir bien los criterios en los que
la decisión se fundará.
Evaluar para clasificar la población: La decisión –explícita o implícita- consiste
en situar a los sujetos unos en relación con los otros: quién es el primero, el
segundo, el último; o qué nota puede atribuirse a cada uno de ellos: sobresaliente,
diez, bueno, suficiente.
Evaluar para hacer el balance de los objetivos intermedios: Es necesario
distinguir dos tipos de evaluación-balance referidas a los objetivos intermedios; en
el primer caso, se trata de decidir si el alumno ha alcanzado los objetivos
intermedios requeridos para poder continuar la secuencia de aprendizaje; en el
segundo, de ver en qué medida dio buenos resultados el aprendizaje concerniente a
los objetivos intermedios de perfeccionamiento. Estos dos tipos de evaluación-
balance condicionan las decisiones correctivas.
Evaluar para diagnosticar: Este tipo de evaluación permite tomar un gran
número de decisiones de ajuste o “de regulación”. Se utiliza cuando el balance se
ha revelado insatisfactorio. Puede referirse a producciones, a procedimientos
utilizados o a procesos mentales no directamente observables.
Evaluar para clasificar en subgrupos: Esta decisión implica la determinación de
subgrupos, homogéneos o heterogéneos, según los casos y las necesidades que se
hayan detectado en los alumnos.
Evaluar para seleccionar: Se trata de ordenar los resultados por orden de
importancia, para tomar decisiones sobre ingreso o diferenciación de las personas
evaluadas; esto supone establecer los niveles para establecer la aceptación o
derivación.
Evaluar para predecir el éxito: Se trata de una evaluación basada en una
investigación anterior que ha establecido una relación entre predictores y criterios
de éxito (por ejemplo, que los niños que tienen un cociente intelectual superior a
120 en un test determinado aprenden a leer aun cuando el medio escolar y familiar
sean muy desfavorables); supone la estabilidad de las condiciones en las que se ha
observado esa relación; entonces, debe emplearse el mismo test, en las mismas
condiciones de evaluación, para sujetos con características similares a las de los
evaluados.(De Ketele, 1984; pp. 30-32).
“¿Quiere usted decir que cada evaluación, cada una, es singular y tiene su
forma propia?”, se preguntará, tal vez, usted. No. Estoy tratando de afirmar que el
problema que resuelve cada evaluación es singular y debe ser encarado de esa
manera. Los instrumentos, los principios y las reglas de procedimiento de las que
disponemos son, afortunadamente, generales. Pueden utilizarse en las situaciones
apropiadas y existen instrumentos apropiados para muchísimas situaciones. Pero,
como en tantas otras cuestiones educativas, el problema básico no está en los
instrumentos, sino en definir la ocasión de su utilización. Esto no es menor en la
enseñanza en general, pero sobre todo, cobra importancia en el tema de
evaluación, donde la recurrencia a cierto instrumental oscureció, a veces, la
deliberación en torno a los propósitos y a los valores implicados.
Como me preocupa que lo que acabo de decir parezca una crítica al uso de
instrumentos adecuados, trataré de evitar esa interpretación. Se ha desarrollado
una buena cantidad de instrumental probado y efectivo para utilizar en las prácticas
evaluativas. El instrumento no resuelve el problema. El problema es el uso que
hacemos de él. Ahora bien, los problemas relativos a evaluación no se resuelven sin
el uso del instrumental adecuado. Ya mismo, vamos a referirnos a eso.
11/26
Los instrumentos para obtener información
La obtención de información constituye el aspecto visible de la evaluación para
los alumnos y para el público en general. Es a lo que habitualmente llamamos
“evaluación”: un cuestionario, problemas para resolver, la elaboración de una
monografía, un proyecto o un diseño, un examen escrito de preguntas o de
selección múltiple, un examen oral, una demostración o cualquier otra acción que
los alumnos deban realizar. Son maneras que tenemos para obtener datos. Esos
datos nos son necesarios para apreciar algún aspecto del aprendizaje.
Cualquiera coincidirá en que es necesario que la información represente lo que
queremos evaluar y no otra cosa. Llamamos a eso “validez”. También tendríamos
derecho a pretender que la información tenga algún grado de exactitud o
consistencia dentro de los límites del tipo de información buscada. O sea, que
resulte un elemento de cierta constancia para el análisis, que aprecie bien el tipo de
cosas sobre la que queremos información y que varíe lo menos posible según sean
los ojos que observen o los oídos que escuchen. Se llama a esto “confiabilidad”.
Para tratar de modo más claro y detallado los conceptos de validez y confiabilidad,
es aconsejable la lectura de Camilloni, A., “La calidad de los programas de
evaluación y de los instrumentos que los componen”, en Camilloni, Alicia R.W. de,
Celman, Susana, Litwin, Edith y Palou de Maté, María del Carmen. La evaluación de
los aprendizajes en el debate didáctico contemporáneo. Buenos Aires, Paidós,
1998; pp. 76-89.
Para que la información sea adecuada y de buena calidad, es necesario utilizar
instrumentos que reúnan requisitos de validez y de confiabilidad. No cualquier
instrumento da cualquier tipo de información. El tipo de conocimientos y de
capacidades que un alumno pone en juego no es el mismo cuando escribe una
monografía que cuando responde a una serie de preguntas cortas o es
entrevistado. Los instrumentos para obtener información sobre el aprendizaje de
los alumnos son como cualquier otro instrumento: sirven para algunas cosas, pero
no para todas y, dentro de las cosas para las que sirven, sirven mejor para algunas
que para otras.
“Vaya con la novedad!”, estará diciendo usted. Tiene razón. Claro que la tiene.
Pero cuando se observa la variedad de propósitos escolares y la relativa
uniformidad de los instrumentos de evaluación sistemática realmente utilizados, se
tiene la impresión de que algo no está del todo bien. O se evalúan pocas cosas de
todo lo que se propone la enseñanza o se está utilizando información insuficiente.
Concluyo. Es imposible evaluar algo si el instrumental que utilizamos no sirve o
es insuficiente para obtener la información necesaria. También, si el instrumento
que utilizamos es poco confiable. O sea, un instrumento debería reunir los dos
atributos. ¿En igual medida? Como desideratum, sí. Sin embargo, en situaciones
reales, esto sucede pocas veces. No siempre los instrumentos válidos para cierto
tipo de propósitos tienen un alto grado de confiabilidad.
Por ejemplo, una entrevista no estructurada descansa en la atención del
entrevistador, en su capacidad de seguir el curso de la conversación, seleccionar la
información relevante, incluir nuevas preguntas o promover nuevos comentarios.
No cuenta, en el momento, con un registro objetivado (aunque pueda consultarlo
después) y su ponderación está sujeta a una serie muy grande de matices. La
posibilidad de que exista constancia en la apreciación de distintos entrevistadores
no es demasiado alta. Sin embargo, en muchas situaciones, la entrevista puede ser
considerada el mejor instrumento para conocer ciertas opiniones, actitudes o
capacidades por parte de una persona. Es válida para eso.
12/26
En el caso de tensión entre validez y confiabilidad, no dude. Opte por la
validez. La razón es muy sencilla ¿de qué sirve tener información muy confiable si
no es la información necesaria según los propósitos de esa evaluación? En ese caso,
la fórmula sería: es necesario utilizar los instrumentos con el mayor grado posible
de validez y procurar, en ellos, la mayor confiabilidad posible.
El uso del instrumento adecuado y eficiente para cumplir con los propósitos que
tenemos en mente debería realizarse con dos prevenciones. (Parece que la cosa no
termina nunca: una vuelta para aquí, otra vuelta para allá).
La primera es con respecto a qué se obtiene mediante la utilización de
instrumentos para recolección y análisis de información sobre el aprendizaje. A
primera vista, podría decirse que se obtiene una medida. “¿Una medida? ¿Porqué
dice eso?”. Bueno, si ubico la posición actual de un alumno o grupo de alumnos y la
comparo con los objetivos, puede decirse que se está midiendo: se establece la
distancia entre el punto actual y el de llegada. En el caso del balance final, se mide
la diferencia entre lo obtenido y lo propuesto. Y así.
Pero la evaluación es más que eso, porque consiste en una apreciación que no
se deduce directamente de la comparación entre información y criterios. La
evaluación se inscribe en una relación social y, como toda relación social incluye
juegos de intereses.
Perrenoud sostiene que la evaluación es siempre una representación construida por
alguien. Implica una valoración inscripta en la relación que une a evaluador y
evaluados en el marco de organizaciones complejas incluidas en entornos sociales
específicos. No es posible, según Perrenoud, considerar la evaluación sin tener en
cuenta el conjunto de los vínculos que se establecen entre profesores y alumnos y,
a través de ellos, entre los respectivos grupos de pertenencia. Por otra parte,
reconocer el rasgo de relación social que comporta la evaluación, lleva a aceptar
que expresa un juego estratégico de intereses diferentes. (Perrenoud, 1999ª).
Otra de las cuestiones necesarias para elegir instrumentos o definir información
necesaria es lo que Perrenoud denomina “la ilusión de la transferencia”. La
transferencia es algo así como la piedra filosofal en la enseñanza. Si pudiéramos
garantizar la transferencia de conocimientos y competencias muchos problemas
educativos estarían solucionados. Los conocimientos aprendidos en una situación
serían aplicados en diferentes contextos y las cosas aprendidas de una manera
podrían ser utilizadas en otras situaciones con características diferentes. Pero,
hasta ahora, eso no se demostró posible fuera de cierto rango limitado. La ilusión
de la transferencia se verifica muy fuertemente en las prácticas evaluativas: se
supone que los rendimientos en un determinado tipo de prueba muestran una
capacidad de otro tipo o utilizable en otras situaciones. Con información
fragmentaria y que toma sólo algunas dimensiones del aprendizaje, se pretende
reconstruir un cuadro completo.
El tipo de información que se necesita y, por lo tanto, el tipo de instrumentos
que debería utilizarse tienen que estar, necesariamente, en función de los
propósitos de cada práctica evaluativa. Ya lo tenía claro Tyler cuando sostenía a
fines de los años cuarenta: “Puesto que la evaluación supone reunir elementos que
certifiquen los cambios de conducta de los estudiantes, todo testimonio válido
acerca de las pautas que procuran los objetivos de la educación constituye un
método idóneo de evaluación”. Tyler, 1998/1949, p. 110. O “El proceso de
evaluación comienza con los objetivos del currículo educacional. Dado que el
propósito fundamental consiste en comprobar en qué medida estos objetivos
realmente se cumplen, será necesario contar con procedimientos de evaluación que
permitan verificar todos los tipos de conductas implícitos en cada uno de los
objetivos principales de la educación”. Tyler, 1998/1949, p. 112.
La información requerida es sumamente variable y, por lo tanto, debería serlo
el instrumental a utilizar. Con lo dicho hasta aquí, debería alcanzar para sostener
13/26
esta afirmación. Pero la realidad es que en las prácticas de enseñanza muchas
veces se utiliza el mismo tipo de información para diferentes momentos y
propósitos
Grondlund plantea una serie de preguntas que el profesor se formula y que pueden
requerir información adecuada. Todas ellas están, por supuesto conectadas con
decisiones que deben ser tomadas. Algunas de esas preguntas son las siguientes:
¿Es realista mi programación para este grupo de alumnos? ¿Cómo agruparlos para
hacer más efectiva la actividad? ¿Están los alumnos preparados para la siguiente
unidad? ¿Dominan los elementos esenciales del curso? ¿Avanzaron más allá de los
objetivos mínimos? ¿Cuánto? ¿Qué tipo de dificultades de aprendizaje tiene estos
alumnos? ¿Cuántos alumnos no pueden aprovechar el curso? ¿A que alumno, o
alumnos, debería enviar a orientación? ¿Qué calificación debería dar a cada uno?
¿Fue eficaz mi trabajo? Grondlund, 1973.
Sin embargo, se cuenta con amplia variedad de instrumentos para la obtención
de información sobre el aprendizaje. Este instrumental puede agruparse en tres
grandes familias que se definen por la técnica principal utilizada. Grondlund, en un
trabajo clásico, propuso tres tipos de procedimiento: de prueba, de información
sobre las personas y de observación Grondlund, 1973.
● Los procedimientos de prueba consisten en tareas que los alumnos deben
realizar. Es lo que usualmente llamamos “prueba” o “examen”.
Todos los tipos de consigna de una prueba podrían clasificarse en una matriz. Por
un lado, tenemos las respuestas admitidas. Pueden ser objetivas, si se admite una
respuesta unívoca, como en el caso de elección múltiple y puede ser que las
respuestas posibles sean variables y el análisis admita el juicio subjetivo del
profesor, como en el caso de un ensayo, una pregunta tradicional de respuesta
larga o una lección oral. Por otro lado, tenemos el tipo principal de actividad de los
alumnos. Puede ser de producción, cuando la respuesta debe ser elaborada por el
alumno, o pueden ser de selección, cuando éste elige la respuesta que cree
correcta de una serie que le ofrece la propia prueba. Es el caso mencionado de la
selección múltiple, del verdadero o falso o del unir con flechas.
Una prueba puede ser homogénea y recurrir a un solo tipo de ítem de prueba o
puede ser armada de modo heterogéneo y recurrir a consignas de distinto tipo. El
lector curioso por el tema encontrará buena bibliografía con descripción de distintos
ítems de prueba, de sus criterios de construcción y de sus utilizaciones
recomendadas. Puede verse el completo trabajo de Jean-Marie De Ketele, Observar
para Educar, punto 4 del capítulo 3, “Los principales tipos de ítems”, páginas 52-
80.
● Las entrevistas son instrumentos utilizados en muchas áreas de actividad. En la
tarea escolar, la entrevista puede utilizarse, por ejemplo, cuando se requiere
información sobre actitudes o intereses, ubicación o percepción de un individuo en
el grupo (cuando se trata, por ejemplo de formar equipos de trabajo), nivel general
de conocimiento y también en prácticas de evaluación conjunta de trabajos entre
profesor y alumno. Las entrevistas pueden ser abiertas o recurrir a formatos
preestablecidos.
● La observación se utiliza cuando se requiere información sobre un desempeño.
Curiosamente, en nuestras escuelas, se utiliza con más frecuencia en los niveles de
la educación inicial y en los segmentos profesionalizados de la educación, cuando se
trata de evaluar desempeños profesionales. (Esto, sin incluir a la educación
deportiva o artística).
¿Usted qué opina? ¿Por qué cree que sucede eso? ¿Entre los propósitos de la
escuela básica y de la escuela media no debería incluirse la capacidad de realizar
algunas cosas? ¿No deberían ser evaluados esos desempeños? Quizás usted podría
confeccionar una lista de tareas que un alumno tendría que saber resolver y que
14/26
deberían ser evaluadas, observando cómo las hace. (Desde ya que no se deberían
considerar aquí las actividades de “lápiz y papel”).
Por último queda una importante pregunta: ¿La evaluación constituye una
actividad de tipo diferente o un énfasis diferente en el continuo de la actividad?
Seguramente, la respuesta varíe según sea la función que se enfatice. Por ejemplo,
desde el punto de vista de la función de regulación, su función formativa, la
evaluación es un momento de la actividad escolar que se distingue más por la
dramatización de la situación que por las tareas realizadas. Seguramente, las
funciones sumativas o certificativa requieran momentos diferenciados. No es una
cuestión de solemnidad. Hace, entre otras cosas, a la mayor transparencia del
proceso cuando se ponen en juego decisiones de orden social.
Le ofrecimos alguna información sobre instrumentos. Como a Galileo, apenas se los
mostramos. A él le alcanzó para abjurar, pero ése no es el caso en esta ocasión. La
variedad es grande y los grados de sofisticación técnica también lo son. Es cuestión
de analizarlos, experimentar con ellos y ver qué tal funcionan y para qué
resultarían adecuados. Pero, sólo de curiosos, un par de preguntas:
● ¿Usted se ve requerido de realizar evaluaciones en su tarea?
● ¿Qué tipo de instrumentos utiliza?
● ¿Por qué los utiliza? ¿Con qué criterios los elige? (Vale decir que son los que tiene
más a mano).
● ¿Qué ventajas y desventajas les encuentra, de acuerdo con sus propósitos y con
sus condiciones de trabajo?
● ¿Incorporaría instrumentos que habitualmente no utiliza? ¿Por qué?
Los criterios para valorar

Los instrumentos son el aspecto más visible. Nos permiten obtener información
relevante. Hasta allí el proceso parece encaminarse hacia una descripción del
estado de cosas. En el caso que estamos tratando, consistiría en una descripción
del aprendizaje de los alumnos. Ahora bien, describir no es equivalente a evaluar.
Ya sé que lo dije. Pero quiero enfatizarlo una vez más. Cuando se evalúa no sólo se
describe un estado de cosas. Principalmente, se aprecia, se valora un estado de
cosas. Se lo valora en función de un estado posible o esperado, de un propósito
trazado o de un principio de acción. Se lo valora en función de algún criterio que el
evaluador o el sistema de evaluación fijaron. El establecimiento claro de los
propósitos de la evaluación está ligado de manera fundamental con el
establecimiento de los criterios que se utilizarán para valorar la información
obtenida y proponer la base para la toma de decisiones.
Bien, utilizamos criterios para valorar ¿Cuáles? En la tradición sobre evaluación
asentada a partir de los años cincuenta, fueron los objetivos los que se utilizaron
como criterio de evaluación de los aprendizajes. La polémica sobre la formulación y
utilización de objetos es larga y no se entrará aquí en ella. Baste decir que los
objetivos son entendidos como afirmaciones sobre posibles resultados de
aprendizaje. Afirmaciones acerca de lo que los alumnos podrán saber o serán
capaces de hacer. La utilización de objetivos como criterios de evaluación proviene
de la clásica obra de Ralph Tyler, Principios Básicos del Currículo.
Para Tyler, la escuela es una institución finalista. Por lo tanto, la evaluación
debería consistir en una comparación permanente entre el punto de partida, la
situación de un alumno o grupo de alumnos en un momento del proceso educativo
y los puntos esperados de llegada. El enfoque de la evaluación por objetivos,
15/26
quedó, luego, estrechamente ligado con la pedagogía de dominio2. Según Tyler, “El
proceso de evaluación significa, fundamentalmente, determinar en qué medida el
currículo y la enseñanza satisfacen realmente los objetivos de la educación. Puesto
que los fines educativos consisten esencialmente en cambios que se operan en los
seres humanos, es decir, transformaciones positivas en las formas de conducta del
estudiante, la evaluación es el proceso de determinar en qué medida se
consiguieron esos cambios”. (Tyler, 1998/1949, p. 109)
Al establecer posibles puntos de llegada, los objetivos ofrecen un criterio para
apreciar avances, logros y problemas. Indican una dirección. También ofrecen un
medio de comunicar a los estudiantes y a la comunidad las aspiraciones de un
proceso educativo. Podría decirse que agregan claridad y transparencia.
Me dirá usted que hay importantes aspectos de las actividades educativas que
no pueden establecerse por medio de objetivos, ya que su esencia consiste en que
los estudiantes desarrollen prácticas y alcancen resultados que no pueden ser
previstos. Para algunos, como Stenhouse, precisamente en eso consiste el mayor
éxito de un proceso educativo: la utilización del conocimiento como instrumento de
producción. (Stenhouse, 1991)3. Desde ese punto de vista las actividades
educativas más valiosas son las de “final abierto”. Creo que no hay una
contradicción absoluta.
Digamos que, en general, orientamos las acciones de dos maneras. Una de
ellas corresponde a la realización de un modelo previamente establecido. Su
eficacia puede analizarse por el ajuste del resultado final a ese modelo. Lo
utilizamos, habitualmente en la producción. Otro tipo de acción se orienta, más
bien, por un principio de acción. Un interrogatorio clínico, un juicio, la escritura
literaria y la investigación se orientan de esta manera. En esos casos, contamos con
un modelo para actuar más que con un resultado predefinido para conseguir.
Supongamos que, como profesor, debo seleccionar actividades para mis
alumnos y pienso en criterios como estos:
● Son preferibles las actividades que permiten a los alumnos interactuar con
objetos y materiales reales.
● Son mejores las actividades que pueden cumplidas con éxito por alumnos con
diversos niveles.
● Las actividades elegidas deberían permitir que los estudiantes apliquen
principios y reglas ya aprendidos para la resolución de sus tareas.
2
La pedagogía de dominio, propuesta a partir de los años cincuenta, procuraba la
individualización para el avance de cada alumno y se basaba en la combinación de varios
elementos. Primero, una adecuada planificación, sistemática y jerarquizada, de los objetivos
de aprendizaje. Segundo, la graduación del nivel de dificultad, provista principalmente por
material instruccional. Por último, una adecuación del ritmo de trabajo y del tiempo
disponible a las capacidades individuales. Se suponía que, de esta manera, la mayoría de los
alumnos estaría en condiciones de alcanzar un nivel aceptable de cumplimiento de los
objetivos.
3
Para Stenhouse (1991; p.122), la educación cumple cuatro funciones básicas. Lo dice así:
“La educación, tal como la conocemos a partir de las escuelas, incluye, necesariamente, al
menos cuatro procesos distintos. Los designaré como entrenamiento, instrucción, iniciación e
inducción”.. El entrenamiento está referido a la adquisición de capacidades que permitan un
desempeño eficaz, como escribir a máquina, hablar un idioma extranjero o manipular
aparatos de laboratorio. La instrucción permite la retención y dominio de información. La
iniciación se ocupa de la familiarización con valores y normas sociales y permite la
interpretación de la interacción humana. La inducción permite la adquisición personal de los
sistemas de pensamiento. Da lugar a la comprensión y al uso productivo de conocimientos.
16/26
● Son preferibles las actividades que... (Usted puede ampliar la lista según su
criterio. Yo adapté algunos del mencionadísimo listado de Raths).
Si usted analiza la lista, verá que no estoy diciendo qué actividades se deberían
elegir. Sólo estoy dando unos principios para elegirlas. No importa las que sean, es
decir, el resultado final de mi tarea, deberían ajustarse a esos principios. Digamos
que esos principios constituyen, también, los criterios para evaluar la eficacia de mi
tarea de selección de actividades.
Pedimos a los estudiantes que realicen muchas tareas cuyo final puede ser
abierto pero que se ajustan a ciertos principios de procedimiento. Esto es muy
evidente en trabajos de investigación. Las conclusiones pueden ser propias, pero se
debe respetar la evidencia disponible, hay que demostrar que se consideraron
conclusiones alternativas, es necesario mostrar que la información es pertinente,
que se analizaron informaciones discrepantes, etc. Lo mismo puede decirse de
tareas de escritura, de producción artística, de análisis, de debates sobre problemas
éticos o sociales. Y la lista puede continuar. Digamos, en este caso, que la clara
definición de los principios de actuación ofrece los criterios.
Si se pretende unificar el lenguaje, por supuesto que estos criterios pueden ser
considerados un tipo de objetivos: los alumnos serán capaces de realizar
experimentos sencillos utilizando las reglas del control de variables, por ejemplo.
Pero prefiero no entrar en la polémica. Digamos que los criterios de valoración
pueden estar constituidos por objetivos o por principios sobre el tipo de acción. O,
en realidad, por ambos para distintas cosas. Mi interés es señalar que los criterios
tienen que estar claros. También, que deberían ser comunicables.
Por último, quisiera marcar que, con independencia de los criterios
desarrollados, hay distintas maneras de apreciar la situación de cada alumno con
relación a esos criterios. La misma situación puede ser valorada según diferentes
parámetros. Dos de los más usuales son los que pueden resumirse así: ¿Valorar el
rendimiento de un alumno o valorar su esfuerzo? ¿Valorar el nivel alcanzado o
valorar el crecimiento en relación con su punto de partida? La definición de estos
parámetros es importante. En cada caso, hay decisiones pedagógicas implicadas.
Yo solo quería, como en otros casos, dejar planteado el asunto.
19.4. ¿Qué cree usted? ¿Qué deberíamos valorar más? ¿El rendimiento o el
esfuerzo? ¿El nivel alcanzado o el progreso en relación con un punto de partida?
● ¿Cree que se deberían usar distintos parámetros para distintas situaciones,
propósitos o funciones de la evaluación? Si es así, ¿a qué parámetro recurriría en
cada caso y cómo lo justificaría?
● ¿Se pueden utilizar distintos parámetros para distintos alumnos o para distintos
grupos? ¿Por qué?
Bien, espero que la realización de las actividades anteriores dé para pensar.
Sólo quiero agregar que se arma un pequeño lío cuando la valoración se expresa en
calificación. Como se verá en el apartado siguiente, la calificación sintetiza muchas
cosas en un solo valor numérico, alfabético o conceptual ¿Deberían llevar notas
equivalentes alumnos cuya producción fue juzgada con parámetros diferentes?
“¿Por qué hace esta pregunta acá? ¿No es que después venía el tema de la
calificación?”, se dirá usted. Es que me pareció que venía a cuento. Ya está
planteada. Ahora vamos por el resto, que, igualmente, será breve.
17/26
La calificación
La calificación es la decisión más frecuente que se toma mediante evaluación
escolar. También es una de las decisiones de más importancia en la vida de
profesores y de alumnos. Todos coincidirán en que la calificación es la expresión de
una valoración del desempeño de un alumno. Pero ¿qué expresa exactamente la
calificación?
Contra la extendida y temprana pretensión de considerar la calificación como una
medida, hoy es difícil aceptar que las prácticas de evaluación escolar constituyen
actos de medición, si las equipara con otros tipos de medición4.
Las tendencias al rigor metodológico procuraron sistematizar prácticas
intuitivas y subjetivas. Desarrollaron sistemas y dispositivos con la intención de que
el resultado expresado en calificaciones fuera un indicador objetivado de “algo”:
una medida precisa de aprendizaje, desarrollo, inteligencia, capacidad o lo que
fuera.
Sin embargo, múltiples investigaciones mostraron la dificultad de la pretensión.
Las calificaciones variaban; las variaciones eran, con mucho, superiores a los
márgenes aceptables de error estadístico; la cantidad de “mediciones” necesarias
para utilizar la media como valor “real” y compensar los márgenes de variabilidad
resultaron tan grandes que se volvía imposible cualquier intento serio de utilizar
este método. (Amiguens y Zerbato-Poudou, 1999, pp. 162-163). En conclusión, el
modelo de medición difundido en los años treinta y cuarenta, y utilizado contra las
prácticas intuitivas anteriores, no mostró viabilidad ni parecía pertinente para
identificar el tipo de cosa que se hacía al calificar una prueba.
La calificación, a diferencia de una medida, no expresa una dimensión sino un
conjunto variable de dimensiones. Un examen, en ese sentido puede ser evaluado,
pero no “(...) en el sentido de medirlo, sino de apreciarlo en referencia con una
escala de valor. (...) La calificación sería un medio para resumir apreciaciones de
naturaleza diferente a fin de comunicarlas a un alumno”. (Amiguens y Zerbato-
Poudou, 1999, p. 163).
La calificación es una síntesis de la diversidad de dimensiones que componen
un producto o una actuación. Es un promedio. Por lo tanto, no es demasiado
informativa, ya que poco dice acerca de cómo se compuso ese promedio. Es
justamente esa composición la que expresa las reales capacidades supuestamente
evaluadas. En el peor de los casos, la calificación expresa una impresión general,
poco apoyada en información fiable y en análisis sistemático. En el mejor, la
calificación expresa la asignación de un valor promedio en un conjunto posible y, en
ese sentido, ofrece una parte, no completa, del análisis que la evaluación
representa.
La calificación, entonces, es una expresión limitada de un rendimiento
educativo. Sin embargo nos resulta útil, dentro de sus límites, y necesaria.
Fundamentalmente, en relación con la función certificadora de la evaluación. Y esta
función mantiene su vigencia en todos los niveles del sistema de educación
escolarizada. La evaluación educativa y sus resultados no son hechos privados.
Forman parte de prácticas públicas que implican acreditación y comunicación: a los
estudiantes, a los padres, a la comunidad, a autoridades o a instituciones con los
cuáles los estudiantes interactuarán en el futuro.
Con independencia de la discusión sobre su carácter de medida, puede concordarse
en que la calificación expresa valores que se distribuyen según algún tipo de escala.
No es lo mismo un “aprobado-desaprobado”, que una escala conceptual, por letras
o numérica. Todo sistema de calificación recurre a un tipo de escala. Es importante
4
Sobre el tema, puede verse en Amiguens y Zerbato-Poudou (1999) el capítulo VII: “Medir,
calificar, evaluar ¿es lo mismo?”.
18/26
conocer sus fundamentos, porque las escalas permiten, o impiden, distinto tipo de
operaciones entre sus valores. Por ejemplo, la habitual realización de promedios
que forma parte de los requerimientos administrativos y, en ocasiones, fuerza las
escalas en las que están expresadas las calificaciones (el bien +, por citar un caso).
También dejan en evidencia que, cuando se utilizan escalas ordinales numéricas, el
promedio no puede ser interpretado de manera literal: “4” no quiere decir que el
alumno sepa la mitad de “8”. Sobre sistemas de calificación el lector interesado
encontrará trabajos muy informados y no insistiré aquí en ello5.
Posibles sesgos en la evaluación

Se constataron una cantidad de efectos sistemáticos que influyen o sesgan la
ponderación de la información que dan las pruebas de los alumnos.
El primer efecto puede llamarse de “normalización”. Parece existir entre los
profesores, una tendencia a distribuir las notas según una curva normal (el típico
“sombrero de Gauss”). O sea, siempre existe una proporción más o menos pareja
de notas buenas, regulares y malas, sean cuáles fueren las características de los
exámenes. También parece influir el orden en el que se corrigen los exámenes: los
primeros suelen obtener mejores notas que los últimos en ser corregidos. Está
bastante constatado la existencia de un efecto de “contraste”. Por este efecto, la
calificación otorgada a un trabajo depende, en alguna medida, de la impresión
acerca de los trabajos anteriores. Un trabajo que obtendría una nota mediana en un
lote de trabajos de calidad superior, puede obtener una nota buena si es corregido
junto con trabajos de calidad inferior. (Amiguens y Zerbato-Poudou, 1999, pp. 164-
165).
De lo anterior se pueden extraer dos conclusiones. La primera es que buena
parte de la actividad de evaluación involucra una comparación entre exámenes o
casos que se realiza en cada práctica de corrección. Esto lleva a una conclusión aun
más importante: la evaluación del trabajo de los alumnos no se realiza mediante la
comparación genérica entre conjuntos de información y criterios objetivos. La
evaluación se realiza en base a un modelo de referencia que el profesor desarrolla.
El modelo de referencia que actúa como patrón personal de evaluación no es
absolutamente fijo. Se reactualiza y estabiliza en cada momento específico de
evaluación. En el inicio de cada tarea evaluativa, algunas informaciones actúan
como “anclas” (Amiguens y Zerbato-Poudou, 1999, p. 165) o puntos de referencia
en función de las cuáles se activa el modelo de referencia del profesor. Podría
agregarse que este modelo de referencia estaría conformado tanto por las anclas
constituidas durante el primer lote de trabajos corregidos o de los primeros
alumnos entrevistados como por lo que Alicia Camilloni denominó “las apreciaciones
personales del profesor”. Estas apreciaciones constituyen “sesgos” o desviaciones
sistemáticas, influidas por algún tipo de creencia o juicio previo, que actúan sobre
el tipo de información priorizada y sobre la valoración que cada profesor realiza de
esa información6.
5
Respecto de este tema, puede consultarse, por ejemplo, el claro y completo trabajo de
Alicia Camilloni “Sistemas de calificación y regímenes de promoción”, En Camilloni, A.,
Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en el debate
didáctico contemporáneo, Buenos Aires, Paidós, 1998.
6
Alicia Camilloni describe distintos sesgos que pueden influir en la apreciación del profesor.
El “efecto de halo” consiste en evaluar un aspecto en función de la impresión personal
general sobre el individuo. A la inversa, “la hipótesis de la personalidad implícita” se basa en
algún rasgo que se generaliza a los demás desempeños. También se verifica como causa de
distorsión en las apreciaciones la primacía de la primera impresión o su contraria, la primacía
de la última impresión. También se releva lo que se dio en llamar “la ecuación personal del
profesor”, que sintetiza una tendencia valorativa general personal que impulsa a ser riguroso
19/26
La función que tenga una práctica evaluativa también modifica los modos de
valorar. Lo jerarquizado cambia. Como señalan Amigues y Zerbato-Poudou, “El
trabajo del maestro que evalúa tareas en su clase no corresponde al del mismo
maestro que las califica después de un examen”. (Amiguens y Zerbato-Poudou,
1999, p. 216). Es muy probable que en un examen con propósitos de certificación
se pondere más el nivel. En las calificaciones otorgadas en el curso de la clase es
posible que el esfuerzo o el avance de un alumno sean muy tenidos en cuenta con
independencia del nivel alcanzado en ese momento.
Hasta ahora se mencionaron sesgos introducidos en la apreciación del
evaluador como efecto de diferentes factores: serie de corrección, tendencia a la
normalización, propósitos, creencias. Es necesario señalar también que el uso de
instrumentos también influye en la producción de los alumnos y, si esto no se tiene
en cuenta, puede distorsionar la interpretación de los resultados. La cosa es como
sigue.
El resultado que se obtiene no es el mismo con independencia de la tarea
propuesta. No es igual redactar un trabajo analizando la emergencia de los
procesos conocidos como Revolución Industrial que seleccionar de una lista cuatro
factores que determinaron la Revolución Industrial, unir con flechas causas y
consecuencias o exponer un punto de vista en un debate sobre esos mismos
procesos. Las tareas implicadas en cada caso son diferentes. Lo que se produce
también, aunque se trata del mismo tema.
Los resultados arrojados por distintos instrumentos no pueden ser
interpretados como equivalentes sin más. Primero, por lo ya dicho. Segundo,
porque la familiaridad o el conocimiento del uso del instrumento influye en la
capacidad de respuesta de los alumnos. Es muy sencillo de entender por lo
anterior. No es lo mismo si un estudiante está familiarizado con el tipo de tarea o
no. La expresión o el uso del conocimiento no es independiente del soporte o del
contexto. En resumen, el propio instrumento y su dominio introducen un sesgo que
debe ser considerado a la hora de ponderar la información.
Hasta ahora se marcaron algunos sesgos que pueden influir en la apreciación de la
información ¿Puede eliminarse su influencia?
Se desarrollaron intentos por “objetivizar” de un modo absoluto la evaluación. O
sea, por utilizar recursos que independizaran de la apreciación del profesor la
obtención de información, su análisis y la calificación correspondiente. Estos
intentos se basaron en una combinación de pruebas objetivas y calificación “por
norma”. En la calificación por norma, la calificación correspondiente a cada alumno
proviene de la comparación de su posición en una curva estadística en relación con
su grupo de clase. De esta manera, los resultados controlaban el “factor profesor”,
simplemente, por el recurso de utilizar una distribución como criterio para la
asignación de notas. Según sea la franja que cada individuo ocupe en una curva
normal de acuerdo con su puntaje bruto –resultado de los test objetivos- recibirá
una nota –puntaje elaborado.
Este extendido modo de calificar, utilizado en los Estados Unidos, fue criticado por
diversos motivos. No dice nada acerca del cumplimiento de objetivos pedagógicos
por parte de los alumnos. Esto es así porque los contenidos de enseñanza deben
ser desagregados para su medición por métodos objetivos y su ponderación
posterior es estadística. Siempre puede tener en cuenta el memorable caso del
alumno que respondió bien todos los ítems de biología menos los referidos a la
célula. Aprobó, aunque desconocía buena parte del fundamento de la materia.
Amiguens y Zerbato-Poudou mencionan el ejemplo de Mager: un alumno que debe
demostrar el procedimiento para preparar café. Realiza bien 9 pasos sobre 10. Pero
o benevolente. Su interesante texto “Las apreciaciones personales del profesor” no fue

publicado y circuló como mimeo.
20/26
omite colocar el filtro. Obtendría un puntaje bruto de 9/10. Pero si se utilizara un
criterio especificado en términos de objetivos la apreciación sería otra: el hecho es
que el alumno no puede resolver la tarea y debería ser calificado en consecuencia.
(Amiguens y Zerbato-Poudou, 1999, p.188). La segunda e importante crítica es
que, en este método para asignar calificaciones, se supone que la distribución
normal es normal. O sea, que siempre habrá alumnos que merecen sobresaliente y
otros reprobado, y que sus proporciones son relativamente fijas. O sea, incurre,
pese a su “objetividad” en el sesgo de la normalización. Desde el punto de vista
pedagógico no deja de ser cuestionable un criterio de este tipo: se supone que la
intervención pedagógica hace algo que no depende tan intrínsecamente de dotes de
otro tipo. Al menos, pocas pedagogías actualmente importantes lo aceptan. Pero,
claro, se abre otra discusión y esta clase no es el lugar. Tercero, la asignación de
calificaciones por norma estadística alienta procesos competitivos de escaso valor
educativo. También desalienta motivos propios para el desempeño personal: el
valor de la producción de un alumno nunca dependerá de su propio esfuerzo, sino
de lo que hagan los demás7.
¿Entonces, si no son tan aceptables los esfuerzos por “objetivizar” el resultado
de la evaluación, tenemos que asumir que, inevitablemente, distintos sesgos
perturbarán nuestra capacidad de apreciar los resultados de nuestros alumnos?
Diría que sí y que no. Influirán, pero pueden ser controlados y su efecto
minimizado.
Es posible hacerlo por varias vías. La primera es, simplemente, conocerlos. Por
lo tanto, hacerlos pasibles de reflexión cuando se analizan críticamente las propias
prácticas evaluativas. No es ninguna garantía, pero siempre ayuda. Como sucede
con el esclarecimiento de nuestras creencias y valores sobre cualquier asunto. El
conocimiento de los supuestos que actúan sobre nuestras apreciaciones siempre
puede ser un factor de importancia para corregir desviaciones.
También puede utilizarse recursos técnicos. El primero, y más importante
quizás, es la clarificación de los criterios. Verá que vuelvo una y otra vez sobre el
asunto. Como señala De Ketele: “En principio, la corrección supone que los criterios
de corrección estén bien precisados y entre ellos los criterios de dominio mínimo y
los criterios de dominio óptimo total. Los criterios no deben establecerse en el
momento de la corrección, sino en el momento de la determinación de los objetivos
y de los ítems de evaluación. No obstante, en el momento de la corrección pueden
aparecer ciertas precisiones suplementarias, sobre todo para los ítems de
producción en los que aparecen muchas formulaciones correctas posibles”. (De
Ketele, 1984, p. 80.)8
7
Quien desee encontrar una clara exposición y crítica de este manera de calificar puede
recurrir al trabajo de Alicia Camilloni, “Sistemas de calificación y regímenes de promoción”,
páginas 168 a 172. En el clásico manual de Robert Ebel Fundamentos de la medición
educacional quien se interese en el tema podrá encontrar un sostén de esta manera de
calificar. Véase el capítulo 12, “Calificaciones y sistemas de calificación”.
8
Jean-Marie De Ketele sugiere el empleo de pautas de corrección que permitan establecer
claramente niveles de dominio e iniciar un diálogo entre el educando y el educador. Las
pautas deben aportar el máximo posible de informaciones pedagógicas, para facilitar el
análisis y la posterior toma de decisiones. A continuación transcribimos una pauta propuesta
por este autor:
Pedro Juan Ana María Etc.
Pregunta 1 (objetivo M P M: dominio mínimo

15)
P: Dominio de perfeccionamiento (por
ej., 3 criterios/5)
21/26
También pueden controlarse los efectos de orden y contraste modificando el
orden en el que se corrige y se revisa. Por ejemplo, cuando uno trata de constatar
si dos pruebas de “seis” o tres de “ocho” son más o menos equivalentes entre sí. Se
puede corregir una pregunta de cada prueba en un orden y, luego, otra en otro
orden. Claro, se necesita realizar al final una lectura completa de cada examen para
tener una imagen de conjunto. La recurrencia a pautas de corrección o cuadros de
corrección, ayuda a revisar cada prueba con un esquema relativamente equivalente
y a sistematizar también la información proveniente del análisis. La elaboración de
estas pautas se basa en una desagregación de los elementos principales que
debería contener la respuesta o de los criterios a los que debería atenerse. Y
siempre está el recurso de la lectura y el comentario por más de un evaluador. Se
trata de un mecanismo difícil de utilizar en las condiciones normales de desempeño
docente; sin embargo, es uno de los recursos más importantes para el
esclarecimiento de pautas y el control de posibles sesgos. Permite, además, una
progresiva mejora en las apreciaciones y un incremento de las variables
consideradas, aunque solo sea por la convergencia de distintas miradas. En muchas
ocasiones, alcanza con el comentario y el debate sobre algunos casos bien elegidos.
La discusión sobre esos casos suele sistematizar elementos de importancia y valor
para el resto del trabajo y de otros procesos de evaluación.
Relaciones entre programación, enseñanza y

evaluación
Seré breve en esto. Según los manuales, la programación tendría que
especificar lo que debe ser enseñado y la evaluación debería relacionarse con el
programa para verificar los ajustes del resultado de la tarea a lo previsto. Cuando
se toma la tradición sucede algo parecido. Recuerdo una anécdota personal que
aconteció durante mi primer año de trabajo como maestro de escuela primaria. El
vicedirector de la escuela me llamó una tarde para tratar de encarrilarme en el
cumplimiento de mis funciones, que, por lo visto, no se encaminaban como era
esperable. Me señaló que él se preciaba de la coincidencia que podía constatarse
entre su planificación anual, la mensual, la semanal, la diaria y el cuaderno de un
alumno. Casi, podría decirse, las pruebas de evaluación se planificaban a partir del
programa anual. Pero el funcionamiento real de los sistemas de enseñanza y de
aprendizaje resulta, siempre, más complejo.
Fijamos nuestras intenciones para la enseñanza en planes de estudio y en
programas de trabajo. El plan de estudios forma parte de las normas legales que
organizan la enseñanza en las escuelas. Ahora bien, nuestros planes suelen
adolecer de un defecto. Según Perrenoud, dicen lo que se debe enseñar, pero no lo
El problema está X X X X
planteado
Revisión crítica de la X X –
literatura
X: Criterio aprendido correctamente
Parte metodológica X X –
–: Criterio presente pero incorrecto
Definición X X –
Blanco: Criterio ausente
Hipótesis X X X –
Ejemplos de encuestas
Estructuración de la – X – –
respuesta
Pregunta 2 (objetivo
15)
22/26
que los alumnos deben aprender. (Perrenoud, 1999a, p. 30). Por otra parte, no
todo lo que se programa se enseña y no todo lo que se enseña se evalúa.
(Perrenoud, 1999a, p. 21). Esto puede ser parte de prácticas mal realizadas. Y
también, una consecuencia de la estructura de la enseñanza y del programa.
Cuando el currículum no define lo que se debe evaluar puede suceder que,
como señala Perrenoud, en muchas ocasiones la evaluación no se ordene en
función de objetivos bien definidos. (Perrenoud, 1999a, p. 55). De hecho, quien
analice los programas oficiales en nuestro país, sean del nivel que sean,
probablemente encontrará dificultades para saber con claridad cuáles son las
pautas que deberán cumplir los alumnos: ¿Deben dominar todo el programa?
¿Deben dominar todas las partes por igual? ¿Cuál es el nivel con el que se espera
que dominen eso? ¿Qué tipos de cosas deben saber o qué desempeño deben tener?
Por otra parte, ¿todo lo que se programa para la enseñanza es pasible de ser
evaluado? Y si lo es, ¿para tomar cualquier tipo de decisión? Un caso de este
problema es el de los contenidos que la reforma de los años noventa en Argentina
dio en llamar “actitudinales”. Identificar este tipo de contenidos tenía, en su origen
en la reforma española de los años ochenta, el sentido de designarlos como objeto
de enseñanza y, por lo tanto, incluirlos en la planificación y en las actividades de la
clase. En un curso de capacitación, hace pocos días, un profesor-alumno preguntó:
“¿Deberíamos evaluar los contenidos actitudinales? ¿Cómo lo haríamos?” Buenas
preguntas. Dejo las respuestas a criterio del lector. Las preguntas ejemplifican una
zona gris en relación con la evaluación que es bueno dejar señalada: la de su
extensión y la de su relación con la enseñanza y el aprendizaje.
Para algunos, “la evaluación es más determinante que los programas en el
desarrollo de una enseñanza”. (Perrenoud, 1999b, p. 101). La afirmación es un
poco fuerte pero, seguro, tiene algo de cierto, porque la evaluación se relaciona con
la enseñanza de un modo íntimo. No solo “comprueba” el alcance. La evaluación
forma parte del programa de enseñanza escrito o no escrito. Normalmente,
adquieren prioridad aquellas enseñanzas que promueven aprendizajes-requisitos
para el grado o nivel siguiente. Muchas veces se construye un contrato tácito entre
los profesores de mayor importancia que lo programado. Son los colegas los que
actúan, muchas veces, como una voz y una mirada sobre el propio trabajo. El
profesor anterior es evaluado por la capacidad y el conocimiento de los alumnos
que salen de sus manos. Para los alumnos, las prácticas de evaluación suelen
convertirse en el “verdadero mensaje”, tanto sobre los contenidos como sobre los
énfasis en el esfuerzo: establecen una jerarquía en la tarea de la clase. Es evidente
que evaluación y programa forman parte de un mismo sistema de enmarcamiento y
regulación de la enseñanza. Por eso, “más vale reformar simultáneamente
programas y procedimientos de evaluación”. (Perrenoud, 1999b, p. 102).
Un último comentario sobre el tema. Se puede constatar una estrecha relación
entre evaluación y currículum en los países que cuentan con fuertes sistemas de
exámenes externos. En esos casos, el examen externo “tira” del contenido del
currículum y de las formas de enseñanza, que tienden a adaptarse a las exigencias
por venir. Esta relación está marcada por la autonomía que estos exámenes
alcanzan y por la reducción que, en general, operan sobre las dimensiones
evaluadas.
Dicho esto, debemos reconocer que, en cualquier circunstancia, la evaluación
modula el currículum. No se sugiere que lo reemplaza o que constituye un
currículum paralelo. Pero sí que genera un sistema de jerarquías y énfasis que da
forma especial al contenido de la enseñanza. Se convierten en más importantes los
temas evaluados, se vuelven más relevantes los tipos de producción exigidas.
Podría decirse que, así como el profesor crea un modelo mental de referencia a la
hora de evaluar a sus alumnos, los estudiantes crean modelos de referencia sobre
lo que es considerado importante en la clase. Los propios profesores se ven
influidos en la enseñanza y el énfasis en ciertos contenidos, por las formas de
23/26
evaluar y por los temas evaluados que la tradición del establecimiento, el
departamento o la cátedra fueron asentando. Puede agregarse que, cuánto más
afirmada está la función de certificación de la evaluación, más actúa como
moduladora del currículum.
La influencia de la evaluación como moduladora del currículum puede ser
valorada como una indeseable desviación de las normas oficiales sobre el contenido
escolar. También, como un dispositivo complementario que actualiza esas normas,
en la medida en que el sistema procede de un modo más o menos coherente al
respecto. En ese caso, “Los criterios de evaluación proporcionan a los alumnos,
cuando se dan al mismo tiempo que las instrucciones, informaciones
suplementarias acerca de los comportamientos esperados que deben permitirles
evaluar mejor sus resultados, pero que posteriormente podrán ser utilizados como
señales que les permitan guiar la realización de la tarea y, por consiguiente, tener
mejores resultados”. (Amigues y Zerbato-Poudou, p. 207).
¿Qué hacer con las prácticas de evaluación?

Aunque ya casi llegamos al final, es difícil decirlo en abstracto, porque cada
respuesta depende del problema que se formule. La realidad es que nuestro país no
viene de una tradición evaluadora basada en la medición, la defensa a ultranza de
las pruebas objetivas y la utilización de normas estadísticas para la adjudicación de
calificaciones. Tampoco tenemos sistemas externos de examen que otorguen
certificaciones en momentos intermedios o finales de la educación general o media
superior. Sin embargo, lo que leemos sobre evaluación suele tener origen en países
con esas características. También, por supuesto, las críticas.
En principio, no es tanto lo que se conoce sistemáticamente sobre las prácticas
de evaluación escolares. No parece ser un fenómeno local. Los estudios sobre este
tema no fueron desarrollados hasta hace poco tiempo. También es cierto que los
nuevos enfoques didácticos dedicaron a la evaluación muy poco desde el punto de
vista propositivo. Quizás, “porque en la mente de los reformuladores, la evaluación
quedó del lado de las obligaciones, la institución y la tradición de la que querían
desembarazarse”. (Amiguens y Zerbato-Poudou, p. 108). Claro que, desde el punto
de vista de la mejora de las prácticas educativas, esto no deja de ser un
inconveniente. Sobre todo, cuando cuesta aceptar dimensiones de esas prácticas
como parte de las pedagogías que uno abraza o admira.
Puedo imaginarme este intercambio:
–Creo –afirma el autor de esta clase– que la evaluación refleja, en buena
medida, el aspecto sistémico de la cuestión educativa.
Ya lo escucho decirme:
-Oiga usted, ¡yo no soy sistémico! Soy, para que lo sepa, constructivista. Lo
demás, corre por su cuenta.
Entiendo sus aprensiones. Mírelo de esta manera. Digamos que la evaluación
por objetivos refleja la dimensión en la cual el dispositivo puede ser considerado un
sistema de producción dirigido hacia objetivos relativamente definidos, al menos en
sus aspectos generales y aunque admitan diversidad de realizaciones específicas. Y
esto, según los niveles educativos y los propósitos de la educación. Usted y yo
coincidiremos en que, cuando se trata del aprendizaje de actividades bien regladas
utilizadas en tareas de importancia social, la variedad de realizaciones admitidas se
reduce en función de la eficacia de la acción, el cuidado de los usuarios y el
cumplimiento del interés social que debe ser servido. Sería muy claro el ejemplo de
cirujanos, pilotos de avión, conductores, enfermeros o técnicos mecánicos de nivel
medio. Si analizamos la educación, también encontramos ejemplos: el dominio de
la lecto-escritura, la capacidad de resolución de problemas matemáticos, el dominio
24/26
de información científica, el conocimiento de las reglas de práctica republicana y
muchos otros. Me dirá usted (verá que lo considero un opositor incansable):
-No son esos los propósitos importantes de la educación.
Bueno, normalmente los consideramos bastante importantes. Y, aunque solo
sean instrumentales para el desarrollo de capacidades de orden más general, para
el ejercicio de aptitudes personales o para la promoción del desarrollo individual y
colectivo, ¿no es adecuado saber si estos instrumentos necesarios forman parte del
equipaje que nuestra sociedad, por medio de la escuela, tiene la obligación de
proveer a cada nuevo miembro?
¡Ríndase de una vez! Acépteme que hay objetivos especificables y valiosos en
toda tarea educativa y que toda tarea educativa puede ser considerada desde un
punto de vista sistémico, aunque éste no sea el único punto de vista posible.
Conceda, al menos, que la tarea educativa merece ser analizada desde puntos de
vista variados, ya que esa es la única manera de lidiar con la variedad de
dimensiones cruzadas en esa práctica.
¿Puede aceptarlo? ¿Diría usted que la evaluación juega un papel importante en
la dimensión sistémica de las prácticas de enseñanza?
Si aceptó eso, continúo. (Vio cómo soy. Desconfíe de las buenas intenciones).
Parece que, también, la evaluación juega un papel de importancia en la regulación
del aprendizaje y de la intervención pedagógica ¿Qué opina de eso?
Cuando termine de pensar su respuesta, estaremos en condiciones de pasarle
la posta.
No sé cómo veía la cuestión al inicio. Pero, ahora:
19.6. ¿Considera que las prácticas evaluativas juegan un rol educativamente
valioso en la enseñanza?
● Si la respuesta es afirmativa, ¿en qué aspectos de la enseñanza resultan
importantes?
● ¿Qué requisitos se deberían tener en cuenta para que estas funciones puedan ser
cumplidas?
● Las funciones que usted establece ¿Son funciones teóricas o realmente pueden
llevarse adelante en situaciones reales de enseñanza?
● ¿Qué límites establecería al cumplimiento de esas funciones y cómo cree que
deberían acomodarse las cosas para que se concrete lo que contestó en los dos
primeros puntos?
Bibliografía
Amiguens, R. y Zerbato-Poudou, M., Las prácticas escolares de aprendizaje y
evaluación, México, Fondo de Cultura Económica, 1999.
Camilloni, A., “Sistemas de calificación y regímenes de promoción”, en Camilloni,
A., Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en
el debate didáctico contemporáneo, Buenos Aires, Paidós, 1998.
Camilloni, A., “La calidad de los programas de evaluación y de los instrumentos que
los componen”, en Camilloni, A., Celman, S., Litwin, E. y Palou de Maté, M., La
evaluación de los aprendizajes en el debate didáctico contemporáneo, Buenos Aires,
Paidós, 1998. pp. 76-89.
De Ketele, J.-M., Observar para Educar, Madrid, Visor, 1984.
Ebel, R., Fundamentos de la medición educacional, Buenos Aires, Guadalupe, 1977.
25/26
Grondlund, N., Medición y evaluación de la enseñanza, México, Pax, 1973.
Perrenoud, P., Avaliacao. Da Excelencia a Regulaçao das Aprendizagens. Entre duas
lógicas, Porto Alegre, Artes Médicas, 1999ª.
Perrenoud, P., Construir competencias desde la escuela, Santiago de Chile, Dolmen,
1999b.
Stenhouse, L., Investigación y desarrollo del currículum, Madrid, Morata, 1991.
Tyler, R., Principios Básicos del Currículo, Buenos Aires, Troquel, 1998.
26/26

Daniel Feldman - Evaluación de La Enseñanza y El Aprendizaje

Caricato da

Informazioni sul documento

Descrizione originale:

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Daniel Feldman - Evaluación de La Enseñanza y El Aprendizaje

Caricato da

Copyright:

Formati disponibili

Evaluación de la enseñanza y el aprendizaje

● Autoridades ¿Qué? (sujeto-objeto)

● Clasificar en el interior de una población ● Examen escrito

● Clasificar en subgrupos ● Entrevista centrada en los objetivos Evaluación puntual centrada

● Descubrir factores ● Observación sistemática Evaluación durante el proceso

¿Por qué? (función: decisión a ¿Cómo? (técnica)

¿Para qué cree usted que está la enseñanza?

Tipos funcionales de evaluación

Evaluación sumativa Evaluación formativa

Destinada a determinar el resultado total Tiene como propósito mejorar el

Amiguens y Zerbato indican que, para muchos autores, la evaluación formativa

Evaluación sumativa interna Evaluación sumativa externa

Consiste en actividades de evaluación Es decidida y diseñada por organismos

En ocasiones, la evaluación sumativa externa tiene carácter certificativo y

● Formativa Regula la acción pedagógica.

● Pronóstica Fundamenta una orientación.

● Diagnóstica Adecua el dispositivo de enseñanza a las capacidades

● Sumativa o Realiza un balance final.

● Certificativa Incorpora al balance final un sistema de calificaciones y

● Informativa Provee datos a la comunidad, los padres, organismos

Adaptado de Perrenoud, 1999ª, pp. 56-57.

La evaluación formativa: evaluar para enseñar, evaluar para aprender

Al final, ¿a qué cosa se llama “evaluar”?

● Incluye obtener información del modo más sistemático posible.

● Supone la valoración de un estado de cosas en relación con criterios establecidos,

● Su propósito es la toma de decisiones.

La evaluación se diferencia de una actividad descriptiva, porque su propósito

Los criterios para valorar

Posibles sesgos en la evaluación

o benevolente. Su interesante texto “Las apreciaciones personales del profesor” no fue

Pedro Juan Ana María Etc.

Pregunta 1 (objetivo M P M: dominio mínimo

Relaciones entre programación, enseñanza y

¿Qué hacer con las prácticas de evaluación?

Potrebbero piacerti anche