Sei sulla pagina 1di 2

4.

-analisis de reactivos
Confiabilidad y validez
Kerlinger y Lee (2002) afirman que para incrementar la confiabilidad y validez de
una prueba es posible ejecutar un conjunto de procedimientos estadísticos llamados
análisis de reactivos. Consiste en evaluar cada reactivo de forma separada para
determinar si el reactivo es bueno o pobre (Escurra, 2011). En pruebas donde las
respuestas se evalúan como correctas e incorrectas (como las pruebas cognitivas
o de rendimiento escolar), los reactivos de evalúan en términos de su nivel de
dificultad (Macia, 2010).
La confiabilidad (o consistencia) de un test es la precisión con que el test mide lo
que mide, en una población determinada y en las condiciones normales de
aplicación. (Anastasi, 1982; Aiken, 1995). (Las condiciones normales de aplicación
se refieren a las condiciones especificadas en el manual del test).
Analizar el índice de dificultad
El índice de dificultad se entiende como la proporción de personas que responden
correctamente el reactivo y el número total de personas que toman la prueba. El
índice de dificultad tiene valores que van de 0 a 1. Cuando el conjunto de
estudiantes responde correctamente casi todos los reactivos de una prueba fácil,
los valores del índice de dificultad están muy próximos a 1. Por el contrario, ante
una prueba que consista de reactivos demasiado difíciles el conjunto de estudiantes
responderá de manera incorrectamente a casi todos los reactivos, los valores del
índice de dificultad están muy próximos a 0. En ambos casos la prueba no revela
las diferencias de las personas en los conocimientos que evalúa. La mayoría de los
creadores de pruebas concuerdan en que los mejores reactivos, en términos de
dificultad, son aquellos con valores entre .5 y .7 (Kerlinger & Lee, 2002). Para
calcular el índice de dificultad se utiliza la siguiente fórmula:
Estandarización y normas
toda prueba estandarizada tiene instrucciones estándar de aplicación y calificación
que deben seguirse estrictamente, sin dejar lugar a la interpretación personal o al
sesgo. La estandarización también incluye aplicar la prueba a una población grande
de personas (muestra de estandarización) seleccionada como representante de la
población meta a la que está destinada la prueba.
El propósito de la estandarización de un instrumento es determinar las
distribuciones de puntuaciones objetivas en la muestra de estandarización. Las
calificaciones crudas obtenidas se trasforman entonces en alguna forma de
calificación derivadas o normas. Los principales tipos de normas son equivalentes
de edad, de grado, grados de percentil ares y calificaciones estándar
Análisis de distractores
para el análisis de distractores se suele empezar por el cálculo de índices de
discriminación y dificultad para cada reactivo. Un segundo análisis se encarga de
los distractores K-1 para cada reactivo. El índice de discriminación de reacción
(D)esto proporciona cierta información sobre el funcionamiento de los distractores
en conjunto. Un D positivo indica que los examinados en el grupo superior tendieron
a seleccionar un distractor. Por otra parte, un indicador D negativo indica que los
distractores se eligieron con mayor frecuencia por examinados del grupo superior
que por los del grupo inferior y que el reactivo debe revisarse, sin embargo, el signo
y la magnitud D no revelan si todos los distractores funcionaron de manera correcta.
5% Reactivos fáciles
20% Medianamente fáciles
50% Con una dificultad media
20% Medianamente difíciles
5% Medianamente fáciles

Kerlinger, F. (1975). Investigación del comportamiento. Técnica y metodología. México:


Interamericana

http://ri.uaemex.mx/bitstream/handle/20.500.11799/33862/secme-17469.pdf?sequence=1

Potrebbero piacerti anche