Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
01-006-104
Daniel Feldman
Índice
Presentación
26 Copias
¿Para qué cree usted que está la enseñanza?
La evaluación como parte de la acción
Tipos funcionales de evaluación
La evaluación formativa: evaluar para enseñar, evaluar para aprender
Al final, ¿a qué cosa se llama “evaluar”?
Los instrumentos para obtener información
Los criterios para valorar
La calificación
Posibles sesgos en la evaluación
Relaciones entre programación, enseñanza y evaluación
¿Qué hacer con las prácticas de evaluación?
Bibliografía
Presentación
La evaluación puede ser tratada en diversas escalas. Algunas de las discusiones
que hoy resultan más álgidas están relacionadas con la existencia de grandes
sistemas de evaluación. Esto puede entenderse si se tiene en cuenta el impacto
político, social y financiero de las evaluaciones estandarizadas y generalizadas. En
algunos países, esas evaluaciones actúan como indicador de la eficacia de la
inversión en educación. Los establecimientos pueden ser rankeados y el sistema
educativo es ponderado según los resultados que obtienen los alumnos. Esta
importancia dada a la evaluación estandarizada suele coincidir con la aceptación de
prácticas institucionalizadas de selección y clasificación de recorridos educativos. La
evaluación estandarizada adquiere cada vez más importancia, inclusive en un país
como la Argentina, que no desarrolló una particular cultura de evaluación
educativa, en comparación con otros países, como Inglaterra, los Estados Unidos y
Francia.
Muchas cosas pueden ser evaluadas en las actividades educativas: el aprendizaje
de los alumnos, los dispositivos, los métodos o las técnicas de enseñanza, el plan
de estudios, materiales, programas o proyectos, los rendimientos cuantitativos de
un sistema, la tarea de los profesores, la calidad de la gestión institucional. Esas
cosas pueden ser evaluadas con distintos propósitos, por distintas personas y
mediante diferentes métodos.
En el siguiente cuadro, estructurado en torno de las preguntas por qué, qué y cómo
evaluar, así como quién evalúa, Jean-Marie De Ketele (1984) sintetiza rasgos
diferenciales de la evaluación:
1/26
¿Quién evalúa?
Auto-evaluación
● Subordinados
● Iguales
● Autoridades
Hétero-evaluación internas
● Personas
independientes
● Certificar (objetivos terminales globales) ● Alumnos ● Enseñanza ● Objetivos ● Técnicas ● Materiales ● Métodos...
2/26
Aquí, se tratará la evaluación desde un punto de vista más bien restrictivo. Se
priorizará la reflexión sobre la evaluación del aprendizaje en la sala de clases. No
quiere decir que no aparezcan cruzadas las demás dimensiones, sino que el lector
notará que, en general, se estará enfocando el tema desde la mirada del que
enseña.
La evaluación siempre fue un tema delicado, ligado con ideas de control y de
selección. En ella se expresa el ejercicio de la autoridad de la escuela y del profesor
y, mirando desde el otro lado, la presión que reciben los alumnos. La evaluación
revela la asimetría del dispositivo escolar y muestra su carácter, muchas veces
arbitrario.
La evaluación tiene, además, varios usos non sanctos, alejados de su función
originaria. Se la usa, por ejemplo, para imponer ritmo de trabajo, mantener el
orden, sancionar o mostrar “quién manda”.
Para el profesor, la evaluación tampoco suele ser uno de los momentos más
gratos de la tarea. Indudablemente, los alumnos no lo ven así; sin embargo,
cualquiera con experiencia en la enseñanza formal recuerda la fatiga de las largas
correcciones, el cansancio de leer, una y otra vez, versiones de lo mismo, la
dificultad de avanzar en textos no siempre claros y de indicar a cada uno lo
necesario, de ponderar los aciertos y los errores a la hora de calificar, de procurar
que las notas correspondan al nivel de producción y de no cometer demasiadas
arbitrariedades.
Desde el punto de vista de la vida cotidiana en las aulas y en las escuelas, la
evaluación, salvo raras excepciones, no es el gran momento de la educación ni para
los profesores ni para los alumnos. Incluso, pocas pedagogías asientan la nobleza
de sus propósitos en la dimensión evaluativa.
Dicho todo lo cual, no tendríamos más que remover tan odioso elemento,
clarificar las relaciones escolares y permitir que profesores y alumnos vivan en un
mundo de serena felicidad y comunión. ¿Está usted dispuesto a proponer tal cosa?
No será el primero al que se le ocurra ni estará solo en el intento. Tampoco dejará
de tener opiniones en contrario ni de ser severamente criticado ¿Dirá usted, acaso,
que podemos retirar, sin más, la evaluación de las prácticas educativas
sistemáticas? ¿Cualquier resultado le daría a usted igual? ¿Está proponiendo que
firmemos un millonario cheque en blanco y que suceda lo que suceda?
El problema es buscar algún punto a partir del cual tratar la cuestión sin caer
en demasiados prejuicios.
Digo “‘demasiados’ prejuicios”, porque es imposible abordar estos temas sin
imágenes y construcciones previas: todos tenemos una valoración positiva o
negativa de la evaluación. ¿Cuáles son las suyas? ¿Con qué tiene asociada la idea
de evaluar?
Desde ahora le adelanto que mi visión no es imparcial y equidistante. No pienso
hacer aquí un repaso de argumentos –aunque me parece una tarea muy valorable-.
Probablemente porque me dedico a la didáctica, consideraré la evaluación como
una variable importante de las actividades de enseñanza. Ya conoce mi opinión.
Debería dar las razones ahora. Allí vamos. Mi punto de partida es una pregunta:
3/26
general, que el mundo adulto tiene algún derecho para decidir cosas que los
jóvenes deberán adquirir para su ingreso en la sociedad.
Éste no es sólo un problema de las escuelas. Toda sociedad conocida estableció
conocimientos, destrezas y disposiciones que los jóvenes debían adquirir durante su
preparación para, luego, formar parte del mundo adulto. Nuestra sociedad realiza
esta preparación en sistemas de gran tamaño. Esto ocurre debido a la complejidad
de nuestra vida, al cúmulo enorme de conocimiento y tecnologías disponibles y a la
cantidad creciente de personas que se incorporan a la vida adulta a partir de esa
preparación especializada.
La expresión de nuestras intenciones educativas tiene un sencillo correlato. Si
esto es lo que pretendemos ¿en qué medida lo estamos logrando? Pregúntelo de
otra manera: ¿deberíamos tener algún medio al alcance para saber si las
importantes intenciones educativas de las escuelas son realizadas? Si se considera
que estas intenciones educativas están directamente ligadas con el desarrollo del
mundo en que vivimos y que no resultan accidentales, sino centrales para su
existencia y mejora, parece casi inevitable dar una respuesta positiva. Tendríamos
así un primer motivo: las acciones de enseñanza tienen tal importancia social que el
hecho de evaluar está vinculado a la importancia otorgada. Pero no es el único
motivo.
Podemos tomar las intenciones educativas y considerarlas, ahora, en una
escala más cercana: la de la tarea en la sala de clases. Todo profesor planifica
ciertas realizaciones. Organiza un sistema para que los alumnos puedan producir
algo: resolver una tarea, analizar un problema, organizar información, diseñar un
proyecto, comprobar una idea, debatir un conflicto, establecer relación entre dos
series de hechos, comparar casos para buscar elementos comunes, conocer una
teoría, inventar un concepto, obtener datos de libros o material informativo,
organizar un grupo pequeño, realizar obras en diferentes lenguajes. La lista puede
continuar. En cualquier concepción constructivista se aceptará que estas actividades
y producciones permiten, dicho en términos muy generales, que los alumnos
“aprendan algo”.
Tanto desde el punto de vista del profesor como desde el del alumno, es
necesario tener algún conocimiento acerca de la eficacia, el éxito o la pertinencia de
las actividades emprendidas. Como sucede en cualquier proceso de producción. En
el caso del profesor, para organizar su intervención, planificar los cambios y
modular la ayuda que preste. En el caso de la integración del sistema, para
asegurarse el cumplimiento de requisitos que el propio sistema de enseñanza fija y
que permiten el paso de los alumnos en los distintos niveles. En el caso de los
alumnos, es necesario porque el conocimiento acerca de la pertinencia y la
dirección de los propios esfuerzos es un elemento de enorme importancia para
mantener la tarea en marcha y realizar las adecuaciones necesarias.
Desde este punto de vista, las actividades de aprendizaje y las de enseñanza
forman parte de acciones productivas. Suelen, en la mayoría de los casos, tener
propósitos bastante definidos y parte de sus resultados puede ser prevista. Si, a
veces, no puede ser previsto el contenido de ese resultado (en el caso de una
investigación, un trabajo artístico o un debate) sí pueden ser establecidos los
criterios mediante los cuales puede ser analizado, juzgado y a partir de los cuales
pueden tomarse decisiones a futuro: podría ser que las conclusiones deban ser
revisadas, o que la información no sea suficiente para apoyar el análisis, o que los
argumentos utilizados no se consideren válidos o que la solución adoptada no
contemple todos los intereses comprometidos. Podría decirse, en resumen, que el
resultado puede ser previsto o que los criterios para analizarlo pueden serlo. En
definitiva, que contamos con algún medio para evaluar las actividades
emprendidas.
4/26
La evaluación como parte de la acción
“¿‘Evaluar’ dijo? ¿Ya volvemos con lo mismo?”, estarán pensando los de la
posición crítica. Acepto que sí. Pero advierta que amplié el contexto. Estoy
considerando la evaluación como un elemento integrante de la acción. Si no, piense
cuando decimos: “Ese actuó a tontas y a locas”, “Se mandó un acting” (si nos
ponemos más técnicos y sofisticados) o “No aprende más: siempre repite lo
mismo”. ¿No está en todo esto la idea de que las acciones presentes y pasadas no
son suficientemente ponderadas para poder tomar mejores decisiones en relación
con las acciones futuras?
La consideración del resultado de nuestras acciones forma parte integrante de
la propia acción. Es el elemento que nos permite darles dirección y, si se permite el
término, eficacia.
Entre los pedagogos la idea de eficacia quedó muy relacionada con algunas
tendencias pedagógicas, más bien vinculadas a lo que se conoce como “tecnología
instruccional”, que, en nuestros pagos, es identificado como “tecnicismo”. Dicho
rápidamente, a mucha gente no le gusta que le hablen de eficacia. Le resulta un
concepto poco educativo. Yo no estoy muy seguro de que sea así. Los seres
humanos procuramos y necesitamos conducir con eficacia nuestras acciones,
simplemente, porque somos seres intencionales. Llamamos “competente” al que
sabe conseguir o resolver los problemas que enfrenta de una manera adecuada y
con una inversión razonable de recursos, energía y tiempo. O sea, al que los
resuelve con eficacia.
Los criterios para juzgar los logros de una acción nos permiten ponderarla en
función de su capacidad de lograr lo que se proponía: la preparación de una buena
cena, el arreglo de la pared, el permiso para ir al campamento, el consentimiento
para una cita, la aceptación de una monografía, el desarrollo de ciertas habilidades
por parte de los alumnos a cargo o lo que sea.
Por supuesto, hablar de eficacia siempre requiere algún criterio o parámetro
sobre la base del cual juzgar los logros de la acción. Esos parámetros pueden
perfectamente ser debatidos y acordados. Pueden ser establecidos por el propio
sujeto, en acuerdo con otros, o aceptados de otras fuentes a las que se les
reconoce legitimidad. En cualquier caso, una vez establecidos, nos ofrecen una
manera de juzgar nuestras acciones y las de otros.
Gran parte de nuestra vida consiste en producir, lograr cosas o alcanzar ciertas
metas. Evaluamos nuestras acciones, entonces, para juzgar su capacidad de
alcanzar las metas propuestas y, de manera muy importante, evaluamos nuestros
desempeños para poder dirigir, modificar o mantener nuestros esfuerzos o, en caso
necesario, para volver a planificarlos. Somos, por esencia, evaluadores: mientras
actuamos, obtenemos información, la comparamos con algunos criterios
establecidos, vamos juzgando y tomamos decisiones en consecuencia. Evaluar es
comparable al hecho de fijar nuestra posición en el mapa, cotejarla con la hoja de
ruta y definir los próximos pasos a tomar.
Si lo miramos de esa manera, ¿evaluar sigue siendo un terrible evento
educativo? “Bueno”, me dirá. “Está presentando la cara linda. Me viene usted con el
argumento de las funciones y su lugar en las acciones intencionales, y suerte que
no me echó encima las teorías cognitivas con todos los mecanismos de planificación
y regulación de la acción. Pero ¿no se está olvidando usted de las calificaciones y de
las aprobaciones y de las desaprobaciones y de las promociones y de las
repeticiones y de todo eso?”
No, no me olvido. Pero tengo mi argumento preparado, como se podrá
imaginar. ¿Acaso no estábamos conversando sobre evaluación?
5/26
“Oiga”, pensará, “se conversa entre muchos y yo estaba aquí, lo más tranquilo,
y usted me vino con todo el fárrago ese de la evaluación”.
Bueno, concedido, yo traje el tema. Pero, no me dirá usted que es un tema sin
importancia. Hasta los niños de primer grado hablan ahora del asunto. Pero ésa no
es la cuestión. Le quería decir yo que, si estábamos hablando de evaluación, no
veía por qué comenzaba a disparar con esa cuestión de exámenes, notas y
reprobados.
“¿Me está tomado el pelo? ¿No es lo que se hace con la evaluación?”
Ahora veo por dónde va. Esa es una de las cosas que se hacen. Pero está lejos
de ser la única. Técnicamente llamamos a eso “función de certificación”. Si toma en
cuenta lo que expliqué hasta ahora, verá que la evaluación tiene como función
principal permitir la toma fundamentada de decisiones. Para eso, se recurre a
información, lo más sistemática posible, y se realizan ponderaciones o juicios
basados en criterios. Una decisión posible puede ser calificar, aprobar o certificar el
cumplimiento de requisitos. Pero otras decisiones, no menos importantes, pueden
consistir en el ajuste de la planificación, la ubicación del grupo antes de comenzar
un curso o la dirección de la actividad de alumnos y profesores durante la tarea. Se
suele llamar a la primera función “diagnóstica” y, a la segunda, “formativa” o “de
regulación”.
Como verá, puede ser que buena parte del problema que aparece con la
evaluación tenga que ver con que el término quedó ligado a una de sus funciones y
con algunos de sus métodos posibles. Vamos a ampliar esa cuestión.
1
Ralph Tyler fue un educador norteamericano de enorme influencia en el pensamiento
educativo de la segunda mitad del siglo XX. Estableció las bases conceptuales para los
modelos de planificación dominantes durante los años 1960 y 1970. Parte de la capacidad de
difusión de su planteo residió en su carácter de mediación y síntesis entre las ideas de los
progresistas y de los eficientistas. Además, su trabajo ofreció un lenguaje claro y práctico,
basado en un esquema de pensamiento razonable y plausible para los profesores y gestores
educativos. Su libro Principios básicos para la elaboración del currículum, publicado por
primera vez en 1949, tuvo un enorme éxito, aunque años después fue duramente atacado
por los reconceptualistas críticos de los setenta. Tyler nunca respondió a las críticas,
argumentando que el propósito de su trabajo era práctico y que solo discutiría con
alternativas prácticas diferentes de la suya.
6/26
Hacia los años sesenta, comenzaron a reelaborarse, sofisticarse y, en algunos
casos, criticarse las ideas de evaluación como comparación con objetivos. Se
incorporaron nuevas e importantes ideas sobre tipos y funciones de la evaluación.
En ese punto nos quedamos en el apartado anterior y a él quiero volver.
Lo que aparece en esos años es la distinción entre tipos de evaluación, entre lo
que se denominó “evaluación sumativa” (o “compendiada”) y “evaluación
formativa”.
7/26
Todas esas reflexiones pueden ser razonables. Igualmente, parece necesario
reconocer que ésta no deja de ser una función escolarmente necesaria y habrá que
ver cómo arreglarse con ella. Las escuelas, tal como existen, califican y aprueban.
Básicamente, se utiliza la evaluación en el cumplimiento de las siguientes
funciones:
Funciones de la evaluación
8/26
la pena anotar: la evaluación formativa cumple su rol de reguladora del aprendizaje
si se inscribe en el marco de una pedagogía diferenciada. O sea, de una ayuda
pedagógica que se diversifica para adecuarse a la individualidad del proceso de
aprendizaje.
Se puede discutir la escala y el grado de la individualización, pero es
indiscutible el factor personal en la construcción del aprendizaje. También la
existencia de distintos estilos, enfoques o tiempos. Si no se quiere aceptar ninguna
diferencia en la calidad de los abordajes personales para aprender, sí se
reconocerán, al menos, la existencia de diferentes necesidades y ayudas en el
proceso de aprender por parte de distintos individuos. Si, en última instancia, el
aprendizaje es individual, la regulación que promueve la evaluación formativa sólo
puede actuar en la medida que cada aprendiz reciba ayuda adecuada a su
necesidad. Éste es el principio general. La manera de concretarse depende de
multitud de factores.
Por supuesto, hablar de evaluación formativa es una cosa y asociarla con una
pedagogía diferenciada es otra. Las condiciones del trabajo escolar no son,
precisamente, una ayuda en ese sentido. Veamos un poco más esta cuestión.
Perrenoud propone considerar formativa una práctica de evaluación continua, si
el profesor tiene la intención de contribuir con las tareas de aprendizaje en curso y
mejorarlas, cualquiera sea el grado en que diferencie la enseñanza ( Perrenoud,
1999a, p. 78. La cursiva es mía). El carácter formativo de la evaluación queda,
entonces, según Perrenoud, asociado con el propósito de participar en la regulación
del aprendizaje o, dicho más simplemente, de cooperar con los alumnos en sus
actividades de aprendizaje.
Esta cooperación se efectiviza de dos maneras. La primera, adaptando el ritmo
y el tipo de ayuda. La segunda, ofreciendo información a los alumnos acerca de sus
tareas, de sus progresos y de sus dificultades, lo que, en términos sistémicos, se
denominaría “retroalimentación informativa”. La evaluación formativa interviene de
manera constante, y no segmentada, en el aprendizaje. No consiste, sólo, en cortes
evaluativos en el proceso de enseñanza a efectos de utilizar secuencias didácticas
de recuperación o remediales.
Se estableció una relación estrecha entre evaluación formativa e intervención
pedagógica; este par es el que actúa en la regulación del aprendizaje. Pero ¿qué
tipo de intervención pedagógica? Quedó claro que alguna que mantenga una
tendencia de diferenciación sin que esto implique, necesariamente, la
individualización de la enseñanza. En mi opinión, debe entenderse como una
adecuación de la ayuda a necesidades que no serán homogéneas pero tampoco
totalmente diversas.
Bien, una tendencia a adecuar el tipo de ayuda. ¿Eso es todo? Probablemente
sí. Según Perrenoud, lo formativo reside en su capacidad de ayudar a los alumnos a
aprender y no en la modalidad de evaluación (Perrenoud, 1999a, p. 103). Tampoco
cree que se deba asociar con un tipo especial de intervención pedagógica. Se puede
ayudar de muchas maneras a los alumnos y lo que se debe procurar es una
ampliación de las intervenciones.
9/26
participaron?” O de las preocupaciones: “Creo que debería disminuir el ritmo”, “Me
parece que este tema precisa más ejercitación”, “Hoy noté muchos errores en la
tarea individual”. O de las “calificaciones”: “Marta mejoró mucho en su rendimiento,
se esfuerza y parece más animada, habría que apoyarla un poco más porque, de
seguir así, puede aprobar la materia”. En todos esos casos, y en muchos más, es
posible hablar de “evaluaciones” que cada docente realiza de forma permanente y
de manera informal.
Pero, normalmente, la referencia a la evaluación alude a una dimensión más
formalizada. Nos referimos a evaluación para denominar momentos especiales en
los que el propósito fundamental consiste en realizar “eso”.
Pero, se estará preguntando usted, ¿este sujeto piensa seguir hablando del
tema sin definirlo?
Creo que hasta ahora nos entendíamos bien sin tanta necesidad de andar
definiendo. Pero, ya que me lo reclama, veamos si podemos ponernos de acuerdo
en los siguientes tres rasgos:
Rasgos de la evaluación
10/26
referirse no a micro-objetivos intermedios, sino a objetivos globales terminales, es
decir, a macro-objetivos que integren un número importante de objetivos
intermedios. Como la certificación es una decisión dicotómica –el alumno tiene o no
tiene la competencia mínima–, es fundamental definir bien los criterios en los que
la decisión se fundará.
Evaluar para clasificar la población: La decisión –explícita o implícita- consiste
en situar a los sujetos unos en relación con los otros: quién es el primero, el
segundo, el último; o qué nota puede atribuirse a cada uno de ellos: sobresaliente,
diez, bueno, suficiente.
Evaluar para hacer el balance de los objetivos intermedios: Es necesario
distinguir dos tipos de evaluación-balance referidas a los objetivos intermedios; en
el primer caso, se trata de decidir si el alumno ha alcanzado los objetivos
intermedios requeridos para poder continuar la secuencia de aprendizaje; en el
segundo, de ver en qué medida dio buenos resultados el aprendizaje concerniente a
los objetivos intermedios de perfeccionamiento. Estos dos tipos de evaluación-
balance condicionan las decisiones correctivas.
Evaluar para diagnosticar: Este tipo de evaluación permite tomar un gran
número de decisiones de ajuste o “de regulación”. Se utiliza cuando el balance se
ha revelado insatisfactorio. Puede referirse a producciones, a procedimientos
utilizados o a procesos mentales no directamente observables.
Evaluar para clasificar en subgrupos: Esta decisión implica la determinación de
subgrupos, homogéneos o heterogéneos, según los casos y las necesidades que se
hayan detectado en los alumnos.
Evaluar para seleccionar: Se trata de ordenar los resultados por orden de
importancia, para tomar decisiones sobre ingreso o diferenciación de las personas
evaluadas; esto supone establecer los niveles para establecer la aceptación o
derivación.
Evaluar para predecir el éxito: Se trata de una evaluación basada en una
investigación anterior que ha establecido una relación entre predictores y criterios
de éxito (por ejemplo, que los niños que tienen un cociente intelectual superior a
120 en un test determinado aprenden a leer aun cuando el medio escolar y familiar
sean muy desfavorables); supone la estabilidad de las condiciones en las que se ha
observado esa relación; entonces, debe emplearse el mismo test, en las mismas
condiciones de evaluación, para sujetos con características similares a las de los
evaluados.(De Ketele, 1984; pp. 30-32).
“¿Quiere usted decir que cada evaluación, cada una, es singular y tiene su
forma propia?”, se preguntará, tal vez, usted. No. Estoy tratando de afirmar que el
problema que resuelve cada evaluación es singular y debe ser encarado de esa
manera. Los instrumentos, los principios y las reglas de procedimiento de las que
disponemos son, afortunadamente, generales. Pueden utilizarse en las situaciones
apropiadas y existen instrumentos apropiados para muchísimas situaciones. Pero,
como en tantas otras cuestiones educativas, el problema básico no está en los
instrumentos, sino en definir la ocasión de su utilización. Esto no es menor en la
enseñanza en general, pero sobre todo, cobra importancia en el tema de
evaluación, donde la recurrencia a cierto instrumental oscureció, a veces, la
deliberación en torno a los propósitos y a los valores implicados.
Como me preocupa que lo que acabo de decir parezca una crítica al uso de
instrumentos adecuados, trataré de evitar esa interpretación. Se ha desarrollado
una buena cantidad de instrumental probado y efectivo para utilizar en las prácticas
evaluativas. El instrumento no resuelve el problema. El problema es el uso que
hacemos de él. Ahora bien, los problemas relativos a evaluación no se resuelven sin
el uso del instrumental adecuado. Ya mismo, vamos a referirnos a eso.
11/26
Los instrumentos para obtener información
La obtención de información constituye el aspecto visible de la evaluación para
los alumnos y para el público en general. Es a lo que habitualmente llamamos
“evaluación”: un cuestionario, problemas para resolver, la elaboración de una
monografía, un proyecto o un diseño, un examen escrito de preguntas o de
selección múltiple, un examen oral, una demostración o cualquier otra acción que
los alumnos deban realizar. Son maneras que tenemos para obtener datos. Esos
datos nos son necesarios para apreciar algún aspecto del aprendizaje.
Cualquiera coincidirá en que es necesario que la información represente lo que
queremos evaluar y no otra cosa. Llamamos a eso “validez”. También tendríamos
derecho a pretender que la información tenga algún grado de exactitud o
consistencia dentro de los límites del tipo de información buscada. O sea, que
resulte un elemento de cierta constancia para el análisis, que aprecie bien el tipo de
cosas sobre la que queremos información y que varíe lo menos posible según sean
los ojos que observen o los oídos que escuchen. Se llama a esto “confiabilidad”.
Para tratar de modo más claro y detallado los conceptos de validez y confiabilidad,
es aconsejable la lectura de Camilloni, A., “La calidad de los programas de
evaluación y de los instrumentos que los componen”, en Camilloni, Alicia R.W. de,
Celman, Susana, Litwin, Edith y Palou de Maté, María del Carmen. La evaluación de
los aprendizajes en el debate didáctico contemporáneo. Buenos Aires, Paidós,
1998; pp. 76-89.
Para que la información sea adecuada y de buena calidad, es necesario utilizar
instrumentos que reúnan requisitos de validez y de confiabilidad. No cualquier
instrumento da cualquier tipo de información. El tipo de conocimientos y de
capacidades que un alumno pone en juego no es el mismo cuando escribe una
monografía que cuando responde a una serie de preguntas cortas o es
entrevistado. Los instrumentos para obtener información sobre el aprendizaje de
los alumnos son como cualquier otro instrumento: sirven para algunas cosas, pero
no para todas y, dentro de las cosas para las que sirven, sirven mejor para algunas
que para otras.
“Vaya con la novedad!”, estará diciendo usted. Tiene razón. Claro que la tiene.
Pero cuando se observa la variedad de propósitos escolares y la relativa
uniformidad de los instrumentos de evaluación sistemática realmente utilizados, se
tiene la impresión de que algo no está del todo bien. O se evalúan pocas cosas de
todo lo que se propone la enseñanza o se está utilizando información insuficiente.
Concluyo. Es imposible evaluar algo si el instrumental que utilizamos no sirve o
es insuficiente para obtener la información necesaria. También, si el instrumento
que utilizamos es poco confiable. O sea, un instrumento debería reunir los dos
atributos. ¿En igual medida? Como desideratum, sí. Sin embargo, en situaciones
reales, esto sucede pocas veces. No siempre los instrumentos válidos para cierto
tipo de propósitos tienen un alto grado de confiabilidad.
Por ejemplo, una entrevista no estructurada descansa en la atención del
entrevistador, en su capacidad de seguir el curso de la conversación, seleccionar la
información relevante, incluir nuevas preguntas o promover nuevos comentarios.
No cuenta, en el momento, con un registro objetivado (aunque pueda consultarlo
después) y su ponderación está sujeta a una serie muy grande de matices. La
posibilidad de que exista constancia en la apreciación de distintos entrevistadores
no es demasiado alta. Sin embargo, en muchas situaciones, la entrevista puede ser
considerada el mejor instrumento para conocer ciertas opiniones, actitudes o
capacidades por parte de una persona. Es válida para eso.
12/26
En el caso de tensión entre validez y confiabilidad, no dude. Opte por la
validez. La razón es muy sencilla ¿de qué sirve tener información muy confiable si
no es la información necesaria según los propósitos de esa evaluación? En ese caso,
la fórmula sería: es necesario utilizar los instrumentos con el mayor grado posible
de validez y procurar, en ellos, la mayor confiabilidad posible.
El uso del instrumento adecuado y eficiente para cumplir con los propósitos que
tenemos en mente debería realizarse con dos prevenciones. (Parece que la cosa no
termina nunca: una vuelta para aquí, otra vuelta para allá).
La primera es con respecto a qué se obtiene mediante la utilización de
instrumentos para recolección y análisis de información sobre el aprendizaje. A
primera vista, podría decirse que se obtiene una medida. “¿Una medida? ¿Porqué
dice eso?”. Bueno, si ubico la posición actual de un alumno o grupo de alumnos y la
comparo con los objetivos, puede decirse que se está midiendo: se establece la
distancia entre el punto actual y el de llegada. En el caso del balance final, se mide
la diferencia entre lo obtenido y lo propuesto. Y así.
Pero la evaluación es más que eso, porque consiste en una apreciación que no
se deduce directamente de la comparación entre información y criterios. La
evaluación se inscribe en una relación social y, como toda relación social incluye
juegos de intereses.
Perrenoud sostiene que la evaluación es siempre una representación construida por
alguien. Implica una valoración inscripta en la relación que une a evaluador y
evaluados en el marco de organizaciones complejas incluidas en entornos sociales
específicos. No es posible, según Perrenoud, considerar la evaluación sin tener en
cuenta el conjunto de los vínculos que se establecen entre profesores y alumnos y,
a través de ellos, entre los respectivos grupos de pertenencia. Por otra parte,
reconocer el rasgo de relación social que comporta la evaluación, lleva a aceptar
que expresa un juego estratégico de intereses diferentes. (Perrenoud, 1999ª).
Otra de las cuestiones necesarias para elegir instrumentos o definir información
necesaria es lo que Perrenoud denomina “la ilusión de la transferencia”. La
transferencia es algo así como la piedra filosofal en la enseñanza. Si pudiéramos
garantizar la transferencia de conocimientos y competencias muchos problemas
educativos estarían solucionados. Los conocimientos aprendidos en una situación
serían aplicados en diferentes contextos y las cosas aprendidas de una manera
podrían ser utilizadas en otras situaciones con características diferentes. Pero,
hasta ahora, eso no se demostró posible fuera de cierto rango limitado. La ilusión
de la transferencia se verifica muy fuertemente en las prácticas evaluativas: se
supone que los rendimientos en un determinado tipo de prueba muestran una
capacidad de otro tipo o utilizable en otras situaciones. Con información
fragmentaria y que toma sólo algunas dimensiones del aprendizaje, se pretende
reconstruir un cuadro completo.
El tipo de información que se necesita y, por lo tanto, el tipo de instrumentos
que debería utilizarse tienen que estar, necesariamente, en función de los
propósitos de cada práctica evaluativa. Ya lo tenía claro Tyler cuando sostenía a
fines de los años cuarenta: “Puesto que la evaluación supone reunir elementos que
certifiquen los cambios de conducta de los estudiantes, todo testimonio válido
acerca de las pautas que procuran los objetivos de la educación constituye un
método idóneo de evaluación”. Tyler, 1998/1949, p. 110. O “El proceso de
evaluación comienza con los objetivos del currículo educacional. Dado que el
propósito fundamental consiste en comprobar en qué medida estos objetivos
realmente se cumplen, será necesario contar con procedimientos de evaluación que
permitan verificar todos los tipos de conductas implícitos en cada uno de los
objetivos principales de la educación”. Tyler, 1998/1949, p. 112.
La información requerida es sumamente variable y, por lo tanto, debería serlo
el instrumental a utilizar. Con lo dicho hasta aquí, debería alcanzar para sostener
13/26
esta afirmación. Pero la realidad es que en las prácticas de enseñanza muchas
veces se utiliza el mismo tipo de información para diferentes momentos y
propósitos
Grondlund plantea una serie de preguntas que el profesor se formula y que pueden
requerir información adecuada. Todas ellas están, por supuesto conectadas con
decisiones que deben ser tomadas. Algunas de esas preguntas son las siguientes:
¿Es realista mi programación para este grupo de alumnos? ¿Cómo agruparlos para
hacer más efectiva la actividad? ¿Están los alumnos preparados para la siguiente
unidad? ¿Dominan los elementos esenciales del curso? ¿Avanzaron más allá de los
objetivos mínimos? ¿Cuánto? ¿Qué tipo de dificultades de aprendizaje tiene estos
alumnos? ¿Cuántos alumnos no pueden aprovechar el curso? ¿A que alumno, o
alumnos, debería enviar a orientación? ¿Qué calificación debería dar a cada uno?
¿Fue eficaz mi trabajo? Grondlund, 1973.
Sin embargo, se cuenta con amplia variedad de instrumentos para la obtención
de información sobre el aprendizaje. Este instrumental puede agruparse en tres
grandes familias que se definen por la técnica principal utilizada. Grondlund, en un
trabajo clásico, propuso tres tipos de procedimiento: de prueba, de información
sobre las personas y de observación Grondlund, 1973.
● Los procedimientos de prueba consisten en tareas que los alumnos deben
realizar. Es lo que usualmente llamamos “prueba” o “examen”.
Todos los tipos de consigna de una prueba podrían clasificarse en una matriz. Por
un lado, tenemos las respuestas admitidas. Pueden ser objetivas, si se admite una
respuesta unívoca, como en el caso de elección múltiple y puede ser que las
respuestas posibles sean variables y el análisis admita el juicio subjetivo del
profesor, como en el caso de un ensayo, una pregunta tradicional de respuesta
larga o una lección oral. Por otro lado, tenemos el tipo principal de actividad de los
alumnos. Puede ser de producción, cuando la respuesta debe ser elaborada por el
alumno, o pueden ser de selección, cuando éste elige la respuesta que cree
correcta de una serie que le ofrece la propia prueba. Es el caso mencionado de la
selección múltiple, del verdadero o falso o del unir con flechas.
Una prueba puede ser homogénea y recurrir a un solo tipo de ítem de prueba o
puede ser armada de modo heterogéneo y recurrir a consignas de distinto tipo. El
lector curioso por el tema encontrará buena bibliografía con descripción de distintos
ítems de prueba, de sus criterios de construcción y de sus utilizaciones
recomendadas. Puede verse el completo trabajo de Jean-Marie De Ketele, Observar
para Educar, punto 4 del capítulo 3, “Los principales tipos de ítems”, páginas 52-
80.
● Las entrevistas son instrumentos utilizados en muchas áreas de actividad. En la
tarea escolar, la entrevista puede utilizarse, por ejemplo, cuando se requiere
información sobre actitudes o intereses, ubicación o percepción de un individuo en
el grupo (cuando se trata, por ejemplo de formar equipos de trabajo), nivel general
de conocimiento y también en prácticas de evaluación conjunta de trabajos entre
profesor y alumno. Las entrevistas pueden ser abiertas o recurrir a formatos
preestablecidos.
● La observación se utiliza cuando se requiere información sobre un desempeño.
Curiosamente, en nuestras escuelas, se utiliza con más frecuencia en los niveles de
la educación inicial y en los segmentos profesionalizados de la educación, cuando se
trata de evaluar desempeños profesionales. (Esto, sin incluir a la educación
deportiva o artística).
¿Usted qué opina? ¿Por qué cree que sucede eso? ¿Entre los propósitos de la
escuela básica y de la escuela media no debería incluirse la capacidad de realizar
algunas cosas? ¿No deberían ser evaluados esos desempeños? Quizás usted podría
confeccionar una lista de tareas que un alumno tendría que saber resolver y que
14/26
deberían ser evaluadas, observando cómo las hace. (Desde ya que no se deberían
considerar aquí las actividades de “lápiz y papel”).
Por último queda una importante pregunta: ¿La evaluación constituye una
actividad de tipo diferente o un énfasis diferente en el continuo de la actividad?
Seguramente, la respuesta varíe según sea la función que se enfatice. Por ejemplo,
desde el punto de vista de la función de regulación, su función formativa, la
evaluación es un momento de la actividad escolar que se distingue más por la
dramatización de la situación que por las tareas realizadas. Seguramente, las
funciones sumativas o certificativa requieran momentos diferenciados. No es una
cuestión de solemnidad. Hace, entre otras cosas, a la mayor transparencia del
proceso cuando se ponen en juego decisiones de orden social.
Le ofrecimos alguna información sobre instrumentos. Como a Galileo, apenas se los
mostramos. A él le alcanzó para abjurar, pero ése no es el caso en esta ocasión. La
variedad es grande y los grados de sofisticación técnica también lo son. Es cuestión
de analizarlos, experimentar con ellos y ver qué tal funcionan y para qué
resultarían adecuados. Pero, sólo de curiosos, un par de preguntas:
● ¿Usted se ve requerido de realizar evaluaciones en su tarea?
● ¿Qué tipo de instrumentos utiliza?
● ¿Por qué los utiliza? ¿Con qué criterios los elige? (Vale decir que son los que tiene
más a mano).
● ¿Qué ventajas y desventajas les encuentra, de acuerdo con sus propósitos y con
sus condiciones de trabajo?
● ¿Incorporaría instrumentos que habitualmente no utiliza? ¿Por qué?
15/26
quedó, luego, estrechamente ligado con la pedagogía de dominio2. Según Tyler, “El
proceso de evaluación significa, fundamentalmente, determinar en qué medida el
currículo y la enseñanza satisfacen realmente los objetivos de la educación. Puesto
que los fines educativos consisten esencialmente en cambios que se operan en los
seres humanos, es decir, transformaciones positivas en las formas de conducta del
estudiante, la evaluación es el proceso de determinar en qué medida se
consiguieron esos cambios”. (Tyler, 1998/1949, p. 109)
Al establecer posibles puntos de llegada, los objetivos ofrecen un criterio para
apreciar avances, logros y problemas. Indican una dirección. También ofrecen un
medio de comunicar a los estudiantes y a la comunidad las aspiraciones de un
proceso educativo. Podría decirse que agregan claridad y transparencia.
Me dirá usted que hay importantes aspectos de las actividades educativas que
no pueden establecerse por medio de objetivos, ya que su esencia consiste en que
los estudiantes desarrollen prácticas y alcancen resultados que no pueden ser
previstos. Para algunos, como Stenhouse, precisamente en eso consiste el mayor
éxito de un proceso educativo: la utilización del conocimiento como instrumento de
producción. (Stenhouse, 1991)3. Desde ese punto de vista las actividades
educativas más valiosas son las de “final abierto”. Creo que no hay una
contradicción absoluta.
Digamos que, en general, orientamos las acciones de dos maneras. Una de
ellas corresponde a la realización de un modelo previamente establecido. Su
eficacia puede analizarse por el ajuste del resultado final a ese modelo. Lo
utilizamos, habitualmente en la producción. Otro tipo de acción se orienta, más
bien, por un principio de acción. Un interrogatorio clínico, un juicio, la escritura
literaria y la investigación se orientan de esta manera. En esos casos, contamos con
un modelo para actuar más que con un resultado predefinido para conseguir.
Supongamos que, como profesor, debo seleccionar actividades para mis
alumnos y pienso en criterios como estos:
● Son preferibles las actividades que permiten a los alumnos interactuar con
objetos y materiales reales.
● Son mejores las actividades que pueden cumplidas con éxito por alumnos con
diversos niveles.
● Las actividades elegidas deberían permitir que los estudiantes apliquen
principios y reglas ya aprendidos para la resolución de sus tareas.
2
La pedagogía de dominio, propuesta a partir de los años cincuenta, procuraba la
individualización para el avance de cada alumno y se basaba en la combinación de varios
elementos. Primero, una adecuada planificación, sistemática y jerarquizada, de los objetivos
de aprendizaje. Segundo, la graduación del nivel de dificultad, provista principalmente por
material instruccional. Por último, una adecuación del ritmo de trabajo y del tiempo
disponible a las capacidades individuales. Se suponía que, de esta manera, la mayoría de los
alumnos estaría en condiciones de alcanzar un nivel aceptable de cumplimiento de los
objetivos.
3
Para Stenhouse (1991; p.122), la educación cumple cuatro funciones básicas. Lo dice así:
“La educación, tal como la conocemos a partir de las escuelas, incluye, necesariamente, al
menos cuatro procesos distintos. Los designaré como entrenamiento, instrucción, iniciación e
inducción”.. El entrenamiento está referido a la adquisición de capacidades que permitan un
desempeño eficaz, como escribir a máquina, hablar un idioma extranjero o manipular
aparatos de laboratorio. La instrucción permite la retención y dominio de información. La
iniciación se ocupa de la familiarización con valores y normas sociales y permite la
interpretación de la interacción humana. La inducción permite la adquisición personal de los
sistemas de pensamiento. Da lugar a la comprensión y al uso productivo de conocimientos.
16/26
● Son preferibles las actividades que... (Usted puede ampliar la lista según su
criterio. Yo adapté algunos del mencionadísimo listado de Raths).
Si usted analiza la lista, verá que no estoy diciendo qué actividades se deberían
elegir. Sólo estoy dando unos principios para elegirlas. No importa las que sean, es
decir, el resultado final de mi tarea, deberían ajustarse a esos principios. Digamos
que esos principios constituyen, también, los criterios para evaluar la eficacia de mi
tarea de selección de actividades.
Pedimos a los estudiantes que realicen muchas tareas cuyo final puede ser
abierto pero que se ajustan a ciertos principios de procedimiento. Esto es muy
evidente en trabajos de investigación. Las conclusiones pueden ser propias, pero se
debe respetar la evidencia disponible, hay que demostrar que se consideraron
conclusiones alternativas, es necesario mostrar que la información es pertinente,
que se analizaron informaciones discrepantes, etc. Lo mismo puede decirse de
tareas de escritura, de producción artística, de análisis, de debates sobre problemas
éticos o sociales. Y la lista puede continuar. Digamos, en este caso, que la clara
definición de los principios de actuación ofrece los criterios.
Si se pretende unificar el lenguaje, por supuesto que estos criterios pueden ser
considerados un tipo de objetivos: los alumnos serán capaces de realizar
experimentos sencillos utilizando las reglas del control de variables, por ejemplo.
Pero prefiero no entrar en la polémica. Digamos que los criterios de valoración
pueden estar constituidos por objetivos o por principios sobre el tipo de acción. O,
en realidad, por ambos para distintas cosas. Mi interés es señalar que los criterios
tienen que estar claros. También, que deberían ser comunicables.
Por último, quisiera marcar que, con independencia de los criterios
desarrollados, hay distintas maneras de apreciar la situación de cada alumno con
relación a esos criterios. La misma situación puede ser valorada según diferentes
parámetros. Dos de los más usuales son los que pueden resumirse así: ¿Valorar el
rendimiento de un alumno o valorar su esfuerzo? ¿Valorar el nivel alcanzado o
valorar el crecimiento en relación con su punto de partida? La definición de estos
parámetros es importante. En cada caso, hay decisiones pedagógicas implicadas.
Yo solo quería, como en otros casos, dejar planteado el asunto.
19.4. ¿Qué cree usted? ¿Qué deberíamos valorar más? ¿El rendimiento o el
esfuerzo? ¿El nivel alcanzado o el progreso en relación con un punto de partida?
● ¿Cree que se deberían usar distintos parámetros para distintas situaciones,
propósitos o funciones de la evaluación? Si es así, ¿a qué parámetro recurriría en
cada caso y cómo lo justificaría?
● ¿Se pueden utilizar distintos parámetros para distintos alumnos o para distintos
grupos? ¿Por qué?
Bien, espero que la realización de las actividades anteriores dé para pensar.
Sólo quiero agregar que se arma un pequeño lío cuando la valoración se expresa en
calificación. Como se verá en el apartado siguiente, la calificación sintetiza muchas
cosas en un solo valor numérico, alfabético o conceptual ¿Deberían llevar notas
equivalentes alumnos cuya producción fue juzgada con parámetros diferentes?
“¿Por qué hace esta pregunta acá? ¿No es que después venía el tema de la
calificación?”, se dirá usted. Es que me pareció que venía a cuento. Ya está
planteada. Ahora vamos por el resto, que, igualmente, será breve.
17/26
La calificación
La calificación es la decisión más frecuente que se toma mediante evaluación
escolar. También es una de las decisiones de más importancia en la vida de
profesores y de alumnos. Todos coincidirán en que la calificación es la expresión de
una valoración del desempeño de un alumno. Pero ¿qué expresa exactamente la
calificación?
Contra la extendida y temprana pretensión de considerar la calificación como una
medida, hoy es difícil aceptar que las prácticas de evaluación escolar constituyen
actos de medición, si las equipara con otros tipos de medición4.
Las tendencias al rigor metodológico procuraron sistematizar prácticas
intuitivas y subjetivas. Desarrollaron sistemas y dispositivos con la intención de que
el resultado expresado en calificaciones fuera un indicador objetivado de “algo”:
una medida precisa de aprendizaje, desarrollo, inteligencia, capacidad o lo que
fuera.
Sin embargo, múltiples investigaciones mostraron la dificultad de la pretensión.
Las calificaciones variaban; las variaciones eran, con mucho, superiores a los
márgenes aceptables de error estadístico; la cantidad de “mediciones” necesarias
para utilizar la media como valor “real” y compensar los márgenes de variabilidad
resultaron tan grandes que se volvía imposible cualquier intento serio de utilizar
este método. (Amiguens y Zerbato-Poudou, 1999, pp. 162-163). En conclusión, el
modelo de medición difundido en los años treinta y cuarenta, y utilizado contra las
prácticas intuitivas anteriores, no mostró viabilidad ni parecía pertinente para
identificar el tipo de cosa que se hacía al calificar una prueba.
La calificación, a diferencia de una medida, no expresa una dimensión sino un
conjunto variable de dimensiones. Un examen, en ese sentido puede ser evaluado,
pero no “(...) en el sentido de medirlo, sino de apreciarlo en referencia con una
escala de valor. (...) La calificación sería un medio para resumir apreciaciones de
naturaleza diferente a fin de comunicarlas a un alumno”. (Amiguens y Zerbato-
Poudou, 1999, p. 163).
La calificación es una síntesis de la diversidad de dimensiones que componen
un producto o una actuación. Es un promedio. Por lo tanto, no es demasiado
informativa, ya que poco dice acerca de cómo se compuso ese promedio. Es
justamente esa composición la que expresa las reales capacidades supuestamente
evaluadas. En el peor de los casos, la calificación expresa una impresión general,
poco apoyada en información fiable y en análisis sistemático. En el mejor, la
calificación expresa la asignación de un valor promedio en un conjunto posible y, en
ese sentido, ofrece una parte, no completa, del análisis que la evaluación
representa.
La calificación, entonces, es una expresión limitada de un rendimiento
educativo. Sin embargo nos resulta útil, dentro de sus límites, y necesaria.
Fundamentalmente, en relación con la función certificadora de la evaluación. Y esta
función mantiene su vigencia en todos los niveles del sistema de educación
escolarizada. La evaluación educativa y sus resultados no son hechos privados.
Forman parte de prácticas públicas que implican acreditación y comunicación: a los
estudiantes, a los padres, a la comunidad, a autoridades o a instituciones con los
cuáles los estudiantes interactuarán en el futuro.
Con independencia de la discusión sobre su carácter de medida, puede concordarse
en que la calificación expresa valores que se distribuyen según algún tipo de escala.
No es lo mismo un “aprobado-desaprobado”, que una escala conceptual, por letras
o numérica. Todo sistema de calificación recurre a un tipo de escala. Es importante
4
Sobre el tema, puede verse en Amiguens y Zerbato-Poudou (1999) el capítulo VII: “Medir,
calificar, evaluar ¿es lo mismo?”.
18/26
conocer sus fundamentos, porque las escalas permiten, o impiden, distinto tipo de
operaciones entre sus valores. Por ejemplo, la habitual realización de promedios
que forma parte de los requerimientos administrativos y, en ocasiones, fuerza las
escalas en las que están expresadas las calificaciones (el bien +, por citar un caso).
También dejan en evidencia que, cuando se utilizan escalas ordinales numéricas, el
promedio no puede ser interpretado de manera literal: “4” no quiere decir que el
alumno sepa la mitad de “8”. Sobre sistemas de calificación el lector interesado
encontrará trabajos muy informados y no insistiré aquí en ello5.
5
Respecto de este tema, puede consultarse, por ejemplo, el claro y completo trabajo de
Alicia Camilloni “Sistemas de calificación y regímenes de promoción”, En Camilloni, A.,
Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en el debate
didáctico contemporáneo, Buenos Aires, Paidós, 1998.
6
Alicia Camilloni describe distintos sesgos que pueden influir en la apreciación del profesor.
El “efecto de halo” consiste en evaluar un aspecto en función de la impresión personal
general sobre el individuo. A la inversa, “la hipótesis de la personalidad implícita” se basa en
algún rasgo que se generaliza a los demás desempeños. También se verifica como causa de
distorsión en las apreciaciones la primacía de la primera impresión o su contraria, la primacía
de la última impresión. También se releva lo que se dio en llamar “la ecuación personal del
profesor”, que sintetiza una tendencia valorativa general personal que impulsa a ser riguroso
19/26
La función que tenga una práctica evaluativa también modifica los modos de
valorar. Lo jerarquizado cambia. Como señalan Amigues y Zerbato-Poudou, “El
trabajo del maestro que evalúa tareas en su clase no corresponde al del mismo
maestro que las califica después de un examen”. (Amiguens y Zerbato-Poudou,
1999, p. 216). Es muy probable que en un examen con propósitos de certificación
se pondere más el nivel. En las calificaciones otorgadas en el curso de la clase es
posible que el esfuerzo o el avance de un alumno sean muy tenidos en cuenta con
independencia del nivel alcanzado en ese momento.
Hasta ahora se mencionaron sesgos introducidos en la apreciación del
evaluador como efecto de diferentes factores: serie de corrección, tendencia a la
normalización, propósitos, creencias. Es necesario señalar también que el uso de
instrumentos también influye en la producción de los alumnos y, si esto no se tiene
en cuenta, puede distorsionar la interpretación de los resultados. La cosa es como
sigue.
El resultado que se obtiene no es el mismo con independencia de la tarea
propuesta. No es igual redactar un trabajo analizando la emergencia de los
procesos conocidos como Revolución Industrial que seleccionar de una lista cuatro
factores que determinaron la Revolución Industrial, unir con flechas causas y
consecuencias o exponer un punto de vista en un debate sobre esos mismos
procesos. Las tareas implicadas en cada caso son diferentes. Lo que se produce
también, aunque se trata del mismo tema.
Los resultados arrojados por distintos instrumentos no pueden ser
interpretados como equivalentes sin más. Primero, por lo ya dicho. Segundo,
porque la familiaridad o el conocimiento del uso del instrumento influye en la
capacidad de respuesta de los alumnos. Es muy sencillo de entender por lo
anterior. No es lo mismo si un estudiante está familiarizado con el tipo de tarea o
no. La expresión o el uso del conocimiento no es independiente del soporte o del
contexto. En resumen, el propio instrumento y su dominio introducen un sesgo que
debe ser considerado a la hora de ponderar la información.
Hasta ahora se marcaron algunos sesgos que pueden influir en la apreciación de la
información ¿Puede eliminarse su influencia?
Se desarrollaron intentos por “objetivizar” de un modo absoluto la evaluación. O
sea, por utilizar recursos que independizaran de la apreciación del profesor la
obtención de información, su análisis y la calificación correspondiente. Estos
intentos se basaron en una combinación de pruebas objetivas y calificación “por
norma”. En la calificación por norma, la calificación correspondiente a cada alumno
proviene de la comparación de su posición en una curva estadística en relación con
su grupo de clase. De esta manera, los resultados controlaban el “factor profesor”,
simplemente, por el recurso de utilizar una distribución como criterio para la
asignación de notas. Según sea la franja que cada individuo ocupe en una curva
normal de acuerdo con su puntaje bruto –resultado de los test objetivos- recibirá
una nota –puntaje elaborado.
Este extendido modo de calificar, utilizado en los Estados Unidos, fue criticado por
diversos motivos. No dice nada acerca del cumplimiento de objetivos pedagógicos
por parte de los alumnos. Esto es así porque los contenidos de enseñanza deben
ser desagregados para su medición por métodos objetivos y su ponderación
posterior es estadística. Siempre puede tener en cuenta el memorable caso del
alumno que respondió bien todos los ítems de biología menos los referidos a la
célula. Aprobó, aunque desconocía buena parte del fundamento de la materia.
Amiguens y Zerbato-Poudou mencionan el ejemplo de Mager: un alumno que debe
demostrar el procedimiento para preparar café. Realiza bien 9 pasos sobre 10. Pero
7
Quien desee encontrar una clara exposición y crítica de este manera de calificar puede
recurrir al trabajo de Alicia Camilloni, “Sistemas de calificación y regímenes de promoción”,
páginas 168 a 172. En el clásico manual de Robert Ebel Fundamentos de la medición
educacional quien se interese en el tema podrá encontrar un sostén de esta manera de
calificar. Véase el capítulo 12, “Calificaciones y sistemas de calificación”.
8
Jean-Marie De Ketele sugiere el empleo de pautas de corrección que permitan establecer
claramente niveles de dominio e iniciar un diálogo entre el educando y el educador. Las
pautas deben aportar el máximo posible de informaciones pedagógicas, para facilitar el
análisis y la posterior toma de decisiones. A continuación transcribimos una pauta propuesta
por este autor:
21/26
También pueden controlarse los efectos de orden y contraste modificando el
orden en el que se corrige y se revisa. Por ejemplo, cuando uno trata de constatar
si dos pruebas de “seis” o tres de “ocho” son más o menos equivalentes entre sí. Se
puede corregir una pregunta de cada prueba en un orden y, luego, otra en otro
orden. Claro, se necesita realizar al final una lectura completa de cada examen para
tener una imagen de conjunto. La recurrencia a pautas de corrección o cuadros de
corrección, ayuda a revisar cada prueba con un esquema relativamente equivalente
y a sistematizar también la información proveniente del análisis. La elaboración de
estas pautas se basa en una desagregación de los elementos principales que
debería contener la respuesta o de los criterios a los que debería atenerse. Y
siempre está el recurso de la lectura y el comentario por más de un evaluador. Se
trata de un mecanismo difícil de utilizar en las condiciones normales de desempeño
docente; sin embargo, es uno de los recursos más importantes para el
esclarecimiento de pautas y el control de posibles sesgos. Permite, además, una
progresiva mejora en las apreciaciones y un incremento de las variables
consideradas, aunque solo sea por la convergencia de distintas miradas. En muchas
ocasiones, alcanza con el comentario y el debate sobre algunos casos bien elegidos.
La discusión sobre esos casos suele sistematizar elementos de importancia y valor
para el resto del trabajo y de otros procesos de evaluación.
El problema está X X X X
planteado
Revisión crítica de la X X –
literatura
X: Criterio aprendido correctamente
Parte metodológica X X –
–: Criterio presente pero incorrecto
Definición X X –
Blanco: Criterio ausente
Hipótesis X X X –
Ejemplos de encuestas
Estructuración de la – X – –
respuesta
Pregunta 2 (objetivo
15)
22/26
que los alumnos deben aprender. (Perrenoud, 1999a, p. 30). Por otra parte, no
todo lo que se programa se enseña y no todo lo que se enseña se evalúa.
(Perrenoud, 1999a, p. 21). Esto puede ser parte de prácticas mal realizadas. Y
también, una consecuencia de la estructura de la enseñanza y del programa.
Cuando el currículum no define lo que se debe evaluar puede suceder que,
como señala Perrenoud, en muchas ocasiones la evaluación no se ordene en
función de objetivos bien definidos. (Perrenoud, 1999a, p. 55). De hecho, quien
analice los programas oficiales en nuestro país, sean del nivel que sean,
probablemente encontrará dificultades para saber con claridad cuáles son las
pautas que deberán cumplir los alumnos: ¿Deben dominar todo el programa?
¿Deben dominar todas las partes por igual? ¿Cuál es el nivel con el que se espera
que dominen eso? ¿Qué tipos de cosas deben saber o qué desempeño deben tener?
Por otra parte, ¿todo lo que se programa para la enseñanza es pasible de ser
evaluado? Y si lo es, ¿para tomar cualquier tipo de decisión? Un caso de este
problema es el de los contenidos que la reforma de los años noventa en Argentina
dio en llamar “actitudinales”. Identificar este tipo de contenidos tenía, en su origen
en la reforma española de los años ochenta, el sentido de designarlos como objeto
de enseñanza y, por lo tanto, incluirlos en la planificación y en las actividades de la
clase. En un curso de capacitación, hace pocos días, un profesor-alumno preguntó:
“¿Deberíamos evaluar los contenidos actitudinales? ¿Cómo lo haríamos?” Buenas
preguntas. Dejo las respuestas a criterio del lector. Las preguntas ejemplifican una
zona gris en relación con la evaluación que es bueno dejar señalada: la de su
extensión y la de su relación con la enseñanza y el aprendizaje.
Para algunos, “la evaluación es más determinante que los programas en el
desarrollo de una enseñanza”. (Perrenoud, 1999b, p. 101). La afirmación es un
poco fuerte pero, seguro, tiene algo de cierto, porque la evaluación se relaciona con
la enseñanza de un modo íntimo. No solo “comprueba” el alcance. La evaluación
forma parte del programa de enseñanza escrito o no escrito. Normalmente,
adquieren prioridad aquellas enseñanzas que promueven aprendizajes-requisitos
para el grado o nivel siguiente. Muchas veces se construye un contrato tácito entre
los profesores de mayor importancia que lo programado. Son los colegas los que
actúan, muchas veces, como una voz y una mirada sobre el propio trabajo. El
profesor anterior es evaluado por la capacidad y el conocimiento de los alumnos
que salen de sus manos. Para los alumnos, las prácticas de evaluación suelen
convertirse en el “verdadero mensaje”, tanto sobre los contenidos como sobre los
énfasis en el esfuerzo: establecen una jerarquía en la tarea de la clase. Es evidente
que evaluación y programa forman parte de un mismo sistema de enmarcamiento y
regulación de la enseñanza. Por eso, “más vale reformar simultáneamente
programas y procedimientos de evaluación”. (Perrenoud, 1999b, p. 102).
Un último comentario sobre el tema. Se puede constatar una estrecha relación
entre evaluación y currículum en los países que cuentan con fuertes sistemas de
exámenes externos. En esos casos, el examen externo “tira” del contenido del
currículum y de las formas de enseñanza, que tienden a adaptarse a las exigencias
por venir. Esta relación está marcada por la autonomía que estos exámenes
alcanzan y por la reducción que, en general, operan sobre las dimensiones
evaluadas.
Dicho esto, debemos reconocer que, en cualquier circunstancia, la evaluación
modula el currículum. No se sugiere que lo reemplaza o que constituye un
currículum paralelo. Pero sí que genera un sistema de jerarquías y énfasis que da
forma especial al contenido de la enseñanza. Se convierten en más importantes los
temas evaluados, se vuelven más relevantes los tipos de producción exigidas.
Podría decirse que, así como el profesor crea un modelo mental de referencia a la
hora de evaluar a sus alumnos, los estudiantes crean modelos de referencia sobre
lo que es considerado importante en la clase. Los propios profesores se ven
influidos en la enseñanza y el énfasis en ciertos contenidos, por las formas de
23/26
evaluar y por los temas evaluados que la tradición del establecimiento, el
departamento o la cátedra fueron asentando. Puede agregarse que, cuánto más
afirmada está la función de certificación de la evaluación, más actúa como
moduladora del currículum.
La influencia de la evaluación como moduladora del currículum puede ser
valorada como una indeseable desviación de las normas oficiales sobre el contenido
escolar. También, como un dispositivo complementario que actualiza esas normas,
en la medida en que el sistema procede de un modo más o menos coherente al
respecto. En ese caso, “Los criterios de evaluación proporcionan a los alumnos,
cuando se dan al mismo tiempo que las instrucciones, informaciones
suplementarias acerca de los comportamientos esperados que deben permitirles
evaluar mejor sus resultados, pero que posteriormente podrán ser utilizados como
señales que les permitan guiar la realización de la tarea y, por consiguiente, tener
mejores resultados”. (Amigues y Zerbato-Poudou, p. 207).
Bibliografía
Amiguens, R. y Zerbato-Poudou, M., Las prácticas escolares de aprendizaje y
evaluación, México, Fondo de Cultura Económica, 1999.
Camilloni, A., “Sistemas de calificación y regímenes de promoción”, en Camilloni,
A., Celman, S., Litwin, E. y Palou de Maté, M., La evaluación de los aprendizajes en
el debate didáctico contemporáneo, Buenos Aires, Paidós, 1998.
Camilloni, A., “La calidad de los programas de evaluación y de los instrumentos que
los componen”, en Camilloni, A., Celman, S., Litwin, E. y Palou de Maté, M., La
evaluación de los aprendizajes en el debate didáctico contemporáneo, Buenos Aires,
Paidós, 1998. pp. 76-89.
De Ketele, J.-M., Observar para Educar, Madrid, Visor, 1984.
Ebel, R., Fundamentos de la medición educacional, Buenos Aires, Guadalupe, 1977.
25/26
Grondlund, N., Medición y evaluación de la enseñanza, México, Pax, 1973.
Perrenoud, P., Avaliacao. Da Excelencia a Regulaçao das Aprendizagens. Entre duas
lógicas, Porto Alegre, Artes Médicas, 1999ª.
Perrenoud, P., Construir competencias desde la escuela, Santiago de Chile, Dolmen,
1999b.
Stenhouse, L., Investigación y desarrollo del currículum, Madrid, Morata, 1991.
Tyler, R., Principios Básicos del Currículo, Buenos Aires, Troquel, 1998.
26/26