Sei sulla pagina 1di 6

ENFOQUES DE LA EVALUACIÓN ESCOLAR:

PRUEBAS NORMATIVAS VS PRUEBAS DE CRITERIOS


Dr. Lamberto Vera Vélez, UIPR, Ponce

En nuestro sistema educativo generalmente las


pruebas y diferentes otros medios de evaluación escolar
están basadas primordialmente bajo dos enfoques: el
normativo o el ligado a criterios. Una misma prueba
puede estar construida de una manera u otra, todo dependerá
del enfoque que el (la) maestro (a) o la institución prefiera,
aunque cada uno tiene sus ventajas y desventajas y a base de
estas es que suelen establecerse la preferencias por uno u
otro enfoque. Veamos a continuación cada uno de estos
enfoques y así poder determinar sus similitudes y diferencias.

Las pruebas normativas son aquellas que comparan a los estudiantes con unas normas
establecidas a base de un grupo representativo ya estudiado. Al igual que las de
aprovechamiento, nos indican lo que los estudiantes han aprendido en determinada
materia o asignatura. Se le llama normalizada porque se establecen normas internas que
vienen a ser los índices estadísticos obtenidos mediante la administración de la prueba a
los grupos representativos previamente estudiados. En la sala de clase se utiliza la curva
estándar de por cientos para calificar a los estudiantes y la misma constituye una norma
establecida por el Departamento de Educación Pública de Puerto Rico, que inclusive se
utiliza también en casi todas las escuelas privadas del país.

PRUEBAS NORMATIVAS ESTANDARIZADAS

Usualmente todas las pruebas estandarizadas como las utilizadas para medir
habilidades generales, inteligencia, entre muchas otras son de enfoque normativo. Para
facilitar una adecuada comprensión del concepto de prueba normalizada o estandarizada
veamos el siguiente ejemplo:

En un determinado distrito escolar se administra una prueba de aprovechamiento


en las destrezas básicas de comunicación en Inglés y se informa que una puntuación de
88 puntos equivale a un rango percentil de 90 y Rosa es una estudiante que obtuvo 88
puntos en dicha prueba. Entonces esto significa que Rosa sobrepasa al noventa porciento
de todos los estudiantes que han tomado esta prueba y que sólo un 10% han realizado una
prueba mejor que ella. En este caso la estadística de rango percentil que indica que 88 =
P 90 es un índice ya establecido al administrarse esta prueba a un grupo de estudiantes
previamente estudiado y que ahora se utiliza como referencia para comparar e interpretar
el resultado de Rosa.

Otro ejemplo lo podemos ver con las pruebas de inteligencia donde se nos
informa que un cociente de inteligencia (IQ) promedio oscila entre 85 a 114 y Gabriel es
una estudiante que obtuvo un IQ de 125. Esto significa que Gabriel está sobre el nivel de
inteligencia promedio y los expertos la clasifican como una persona de inteligencia
ENFOQUES DE EVALUACIÓN ESCOLAR ________________________________________ 2

superior. La escala de inteligencia es una escala ya establecida una vez que estas pruebas
han sido administradas y analizadas científicamente por muchos años con muestras de
estudiantes similares a Gabriel. Los datos estadísticos ya establecidos en escalas,
promedios, rangos percentiles, entre otros vienen a constituir normas a base de las cuales
sirven de referencia para comparar e interpretar la ejecución de los estudiantes.

Entre estos tipos de pruebas tenemos las de inteligencia, de personalidad y


aptitudes especiales. Estas son pruebas normativas que han sido preparadas por grupos
de expertos que provienen de agencias o instituciones tales como el mismo Departamento
de Educación Pública. Estas pruebas generalmente no las corrigen los maestros ya que las
mismas son pruebas institucionales que responden a situaciones particulares de la labor
profesional de orientadores, sicólogos u otro personal administrativo. Dentro de estos
tipos de pruebas están las del College Entrance Examination Board (CEEB) que se
utilizan para la selección y ubicación de estudiantes al ingresar a las universidades, la
Prueba de Certificación de Maestros del Departamento de Educación Pública, entre
muchas otras a nivel del gobierno estatal y federal para la selección del personal para el
servicio público.

Si se fuera a crear una prueba normativa o estandarizada en una determinada


materia o disciplina esto requeriría contratar personas especializadas en la materia o
disciplina que estudiarían los objetivos y contenido del curso o currículo que se interesa
probar. A base de este contenido y objetivos se prepara la planilla de especificaciones
para elaborar la prueba que fuera balanceada y fielmente representativa del curso o
currículo a examinarse. Luego, habrá que seleccionarse una muestra representativa de los
estudiantes que toman este tipo de curso. Una vez administrada, se corrige la prueba, se
organizan sus resultados, se procede a un análisis de ítemes y estadístico para obtener los
cómputos matemáticos que resultarán en las estadísticas básicas (promedio, desviación
estándar, rangos percentiles, coeficiente de confiabilidad, margen de error de la prueba,
entre otros). Estas estadísticas básicas vienen luego a constituir las normas mediante las
cuales se utilizarán para comparar e interpretar los resultados de los estudiantes que
tomen luego esta prueba. En resumen, todo esto conlleva un proceso de investigación
científica que requiere que la prueba se tenga que administrar varias veces y repetir su
análisis hasta que la misma se considere suficientemente válida y confiable.

PRUEBAS NORMATIVAS EN LA SALA DE CLASE

La mayoría de las pruebas que elaboran los maestros para medir el nivel de
aprovechamiento académico, generalmente se pueden considerar como pruebas
normativas ya que para la interpretación de sus resultados se utilizan unas normas ya
establecidas en el sistema educativo. Por ejemplo, la escala de porcientos para
determinar las calificaciones de A, B, C, D y F viene a constituir una norma y la
ejecución de los estudiantes se compara con la que hacen otros estudiantes. Por ejemplo,
si Enrique obtuvo 95 puntos en la prueba de Inglés, está establecido como norma decir
que Enrique realizó una excelente prueba mediante la cual se le califica con A y si la
puntuación de 95 corresponde a un rango percentil de 98, esto indicaría que Enrique
sobrepasa el 98 por ciento de los estudiantes de su clase. De este modo podemos
considerar las pruebas de salón de clase como pruebas normativas, pero no
ENFOQUES DE EVALUACIÓN ESCOLAR ________________________________________ 3

estandarizadas. Cuando decimos prueba estandarizada nos referimos a una prueba


normativa, pero que la misma conllevó un proceso de experimentación e
investigación científica para establecer su validez y nivel de confiabilidad.

PRUEBAS DE CRITERIO

Las pruebas ligadas a criterio son aquellas pruebas cuyo propósito es obtener
información sobre lo que los estudiantes saben o son capaces de hacer. Se preparan para
determinar si éstos poseen dominio en unas destrezas específicas. Se llaman pruebas de
criterio porque la ejecución de los estudiantes se interpreta a base de unos criterios
previamente establecidos por cada destreza que se vaya a medir. Por cada destreza se
establece un punto de ejecución mínima (P.E.M.) y este punto de ejecución mínima
(P.E.M.) viene a constituir el criterio a base del cual se determinará si los estudiantes
dominan o no el uso de la destreza. En este tipo de prueba los resultados de cada
estudiante se comparan con el criterio establecido (P.E.M.). A diferencia de las pruebas
normativas, que comparan más la ejecución de los estudiantes con el grupo, en estas
pruebas el énfasis mayor es comparar a los estudiantes con el nivel de dominio
establecido en la destreza de acuerdo al P.E.M.

PROCEDIMIENTOS EN LA ELABORACIÓN DE PRUEBAS DE CRITERIOS:

La evaluación por destreza se orienta según el dominio de competencias por los


estándares de excelencia establecidos en el sistema escolar. Son los maestros o personas
especializadas en la materia o disciplina de estudio, quienes determinan las destrezas
específicas que se desean medir y evaluar. Cada destreza debe ser evaluada con no menos
de cinco (5) itemes. ( DEPR., 2000 ) Si se quiere estar más seguro, entonces se procede
aumentar el número de itemes. No todas las destrezas se miden con el mismo número de
itemes.

Una vez que se haya determinado el número de itemes por cada destreza a
evaluar, se procede entonces a establecer por consenso el punto de ejecución mínima para
determinar dominio o no dominio de la misma. Generalmente, se establece un nivel de
dominio de un 70 por ciento por cada tarea o destreza que se vaya a medir, aunque el
mismo pueda variar según el nivel de rigor académico que se desee establecer. Ningún
punto de ejecución debe estar por debajo de 60% o 3 de 5 itemes. ( DEPR., 2000 ). A
continuación se presenta la Tabla de Conversión del Departamento de Educación Pública
de Puerto Rico donde se indica la relación de los valores porcentuales por puntos de
ejecución mínima, según el número de itemes que se establezca por destreza ( DEPR.,
2000 ).

Otro aspecto de suma importancia que hay que tener en consideración en este tipo
de prueba, es que las preguntas o ítemes se preparan de tal modo que todos tengan un
mismo nivel de dificultad para poder probar cada destreza. Veamos el siguiente ejemplo
de lo que en realidad es una prueba de criterio:
ENFOQUES DE EVALUACIÓN ESCOLAR ________________________________________ 4

TABLA DE CONVERSIÓN DE VALORES DE DOMINIO


DE DESTREZAS A VALORES PORCENTUALES

Número de
itemes por Relación de valores porcentuales por puntos de ejecución mínima
destrezas
5 3 (60%) 4 (80%) 5 (100%)
6 4 (67%) 5 (83%) 6 (100%)
7 4 (57%) 5 (71%) 6 (86%) 7 (100%)
8 5 (63%) 6 (75%) 7 (88%) 8 (100%)
9 5 (56%) 6 (67%) 7 (78%) 8 (89%) 9 (100%)
10 6 (60%) 7 (70%) 8 (80%) 9 (90%) 10 (100%)

Un (a) maestro (a) desea saber si sus alumnos dominan adecuadamente las reglas
de acentuación una vez que haya llevado a cabo varias lecciones de clase. A tal efecto,
prepara una prueba de acentuación de palabras y dispone 10 palabras agudas, 10 llanas y
10 sobresdrújulas. Por cada tipo de acentuación establece un punto de ejecución mínima
de un 70 por ciento que vendría a ser 7 de 10. Por lo tanto, todo estudiante que contesta
correctamente 7 o más demuestra dominio en las destrezas de acentuación.

DESTREZA NUMERO DE ITEMES P.E.M.


1. Acentuación de palabras agudas 10 7
2. Acentuación de palabras llanas 10 7
3. Acentuación de palabras sobresdrújulas 10 7

Generalmente, las pruebas de criterio son muy útiles y fáciles de preparar cuando
se trata de medir destrezas básicas de asignaturas o materias como el Español, Inglés y
Matemáticas. Cuando se trabaja con una destreza es cuestión de disponer un número de
itemes y establecer un P.E.M. Por ejemplo, si se va a probar con los estudiantes su nivel
de dominio en la multiplicación de fracciones - en este caso todos los itemes
prácticamente vienen a ser del mismo nivel de dificultad - se procede entonces a
proveerles un ejercicio, digamos de 20 itemes. Si se establece un 70 por ciento de
ejecución mínima resultaría entonces un P.E.M. de 14, lo cual quiere decir que para que
un estudiante demuestre dominio debe de contestar correctamente 14 o más del total de
20 problemas de multiplicación de fracciones.

Cuando se trata de una disciplina o asignatura como Historia o Ciencias Sociales


y se pretende medir el nivel de dominio en un concepto requiere un poco más de esfuerzo
y cuidado, tanto al elaborar como al corregir la prueba. Digamos por ejemplo, en un
curso de historia se desea medir el nivel de dominio sobre el concepto de areyto mediante
la preparación de cinco ítemes o preguntas. El (la) maestro (a) puede ubicar dos
preguntas sobre el concepto del areyto en el ejercicio de selección múltiple, uno en el
pareo y digamos que dos en el cierto y falso. Esto haría un total de cinco itemes y si se
establece un mínimo de ejecución de 70 por ciento, entonces resultaría un P.E.M. de por
lo menos 3 de 5. Al corregir cada examen el (la) maestro(a) tiene que examinar
cuidadosamente cada concepto que haya dispuesto en el examen y ver por cada
ENFOQUES DE EVALUACIÓN ESCOLAR ________________________________________ 5

estudiante cuantas de sus respuestas resultaron correctas y determinar así su nivel de


dominio. Esto sería una tarea que requiere más tiempo ya que tiene que ir de ejercicio en
ejercicio en la prueba y hacerlo por cada estudiante.

LIMITACIONES Y VENTAJAS

Las pruebas de criterio pueden considerarse como unas pruebas que requieren
más esfuerzo y tiempo de parte de los maestros en su elaboración y corrección. Sin
embargo, son quizás las mejores pruebas para individualizar el proceso evaluativo porque
atiende más a cada estudiante al examinarse cada uno con relación al nivel de dominio de
las destrezas según un punto mínimo de ejecución establecido. Además, al disponer un
sinnúmero de ítemes por destreza, facilita a que los estudiantes tengan una mayor
oportunidad para demostrar su consistencia en sus respuestas y por tanto estas pruebas
resultan ser una de las más confiables para determinar el nivel de aprendizaje alcanzado
por los alumnos.

Los resultados de las pruebas de criterio revelan que destrezas y conceptos que
el(la) estudiante ha desarrollado. Las destrezas específicas del nivel instruccional se
identifican para el desarrollo individual del estudiante. Usualmente estas pruebas
requieren que los maestros diagnostiquen las necesidades de los estudiantes y provean
para la enseñanza individualizada de éstos. Las pruebas de criterio son más prácticas
cunando se utilizan con destrezas básicas o conceptos bien definidos.

Por el contrario las pruebas normativas comparan la ejecución del (la ) estudiante
con relación a unas normas establecidas las cuales están basadas en parámetros
establecidos según la ejecución de un grupo determinado y por tanto lo que se enfoca
aquí como el estudiante compara con el grupo examinado. No tienen valor independiente
de su valor comparativo. El uso de estas pruebas garantiza que igual número de
estudiantes calificará sobre y bajo el nivel del grado o promedio. El propósito de estas
pruebas es más para diferenciar los estudiantes. La equivalencia en notas, promedios,
porcentiles no le indican al maestro las destrezas y conceptos que el (la) estudiante ha
dominado.

PRUEBAS NORMALIZADAS PRUEBAS DE CRITERIO


Propósito: Determinar la ejecución global Propósito: Describir la ejecución del (la)
en determinada destrezas o conceptos, estudiante de acuerdo a unos criterios
tomando como referencia a un grupo establecidos previamente para determinar
normativo que sirve de base como muestra el dominio o no-dominio de un concepto o
representativa. Determinar la posición de destreza.
un estudiante en un grupo.
Elaboración: Personas especializadas en Elaboración: Maestros o personas
la materia si se trata de las pruebas especializadas en la materia, a base de los
estandarizadas. Tomando como base los objetivos, destrezas y conceptos que se
objetivos y contenido de enseñanza se desean examinar determinan la cantidad de
elabora una planilla de especificaciones y itemes necesarios. Se procura la cantidad
se procura por construir una prueba de itemes, de igual dificultad, para cada
ENFOQUES DE EVALUACIÓN ESCOLAR ________________________________________ 6

balanceada y representativa, esto es, valida destreza o concepto a examinar. Luego por
y confiable del curso o área a examinarse. consenso se establece el criterio o punto de
ejecución mínima para determinar el nivel
de dominio o no-dominio de las destrezas.
Valoración: Luego de corregirse las Valoración: Cada prueba se corrige por
pruebas, se organizan los datos, se llevan a separado y se examina la puntuación
cabo los cómputos estadísticos para obtener obtenida de cada estudiantes por destreza o
las estadísticas básicas descriptivas y las conceptos examinados y se evalúa en
puntuaciones obtenidas se interpretan a relación a los criterios de ejecución
base de una curva o normas de previamente establecidos.
calificaciones ya establecidas.
Distribución de los resultados: Los Distribución de los resultados: Se
resultados se disponen a los largo de la dispone mediante una distribución bi-
curva normal. A la izquierda, las modal: los no diestros al lado izquierdo y
puntuaciones bajas, en el centro ls los diestros al lado derecho. (ver diagrama)
puntuaciones promedios y a la derecha las
puntuaciones altas. (Ver diagrama)
Usos de los resultados: Aunque Usos de los resultados: Aunque se
usualmente para calificar a los estudiantes utilizan para calificar y determinar nivel de
y sirven de basa para efecto de promoción, ejecución académica, tienen mayor uso
tienen mucho uso para la administración para individualizar la enseñanza. De
escolar. Fundamentar propuestas escolares, mayor utilidad para el maestro en la sala de
cambios curriculares, establecer clase al atender necesidades individuales de
comparaciones entre grupos y escuelas, los estudiantes según su ejecución de las
entre otros. destrezas y conceptos examinados.

Para ejemplos de este tipo de prueba, planilla de especificaciones e inclusive su


tabulación véase: Vera Vélez Lamberto. Medición, “Assessment”y Evaluación del
aprendizaje. Hato rey: Publicaciones Puertorriqueñas Editores, 2003. ( Capítulos 8,
págs. 188; 192 – 196; Apéndice, p. 445)

PROMEDIO NO DIESTROS DIESTROS


Punto de ejecución mínima

Potrebbero piacerti anche