Sei sulla pagina 1di 5

NATURALEZA Y USOS DE LAS PRUEBAS PSICOLÓGICAS

Autor: Robert J. Gregory


Si se pregunta al ciudadano promedio “¿qué sabe usted acerca de las pruebas psicológicas?”, es
probable que mencione algo sobre pruebas de inteligencia, manchas de tinta y cuestionarios de
verdadero y falso como el muy conocido MMPI. Muy probablemente su idea de las pruebas se
concentrará en la cuantificación de la inteligencia y en la detección de problemas de personalidad;
esta es la perspectiva común del uso de las pruebas en nuestra sociedad. Desde luego, hay algo de
verdad en este punto de vista tan generalizado: las medidas de la personalidad y de la inteligencia aún
son las bases esenciales de la evaluación psicológica. Sin embargo, los diseñadores de las pruebas
modernas han elaborado muchos otros tipos de instrumentos para fines diversos y novedosos, que los
pioneros de la evaluación ni siquiera imaginaron. El objetivo de este capítulo es analizar las variadas
aplicaciones de las pruebas psicológicas, así como revisar las consecuencias éticas y sociales de esta
actividad.
En esa sección se examinan los linchamientos profesionales que tienen efecto sobre la aplicación de
pruebas y se revisa la influencia de los antecedentes culturales sobre los resultados de las mismas.
CONSECUENCIAS DE LA EVALUACIÓN
Desde el nacimiento hasta la vejez, nos enfrentamos a evaluaciones casi en cualquier momento crucial
de nuestra vida. La primera evaluación de un bebé, que se realiza inmediatamente después del
nacimiento, es la prueba Apgar, una valoración rápida y multivariada de la frecuencia cardiaca, la
respiración, el tono muscular, la irritabilidad refleja y la coloración. La calificación total de Apgar
(de 0 a 10) ayuda a determinar la necesidad de cualquier atención médica inmediata. Posteriormente,
un recién nacido que obtuvo una calificación baja de Apgar, podría ser candidato para la evaluación
de un problema del desarrollo.
El niño en edad preescolar tal vez tenga que responder pruebas para verificar si está listo para ingresar
a la escuela. Una vez que inicia su vida escolar, el estudiante enfrentará cientos, quizás miles, de
evaluaciones académicas antes de graduarse, sin mencionar la posible aplicación de pruebas para
problemas de aprendizaje, talentos excepcionales, intereses vocacionales y admisión universitaria.
Después de la graduación, los adultos suelen responder pruebas para obtener un empleo, la licencia
de conducir, pases de seguridad, diagnóstico de la personalidad, compatibilidad marital, problemas
del desarrollo, disfunción cerebral; la lista es interminable. Incluso algunas personas deben enfrentar
la deshonra en la fragilidad de su vejez: una prueba para determinar su capacidad para manejar asuntos
financieros.
Las pruebas se utilizan casi en cualquier país del mundo con fines de orientación, selección y
colocación, en escenarios tan diversos como escuelas, oficinas gubernamentales, industrias, clínicas
médicas y centros de orientación. La mayoría de las personas han resuelto docenas de pruebas sin
siquiera reparar en ello. No obstante, en el momento en el que el individuo típico alcanza la edad de
jubilación, es muy probable que los resultados de las pruebas psicológicas hayan afectado su destino.
Es probable que la desviación del curso de la vida, motivada por los resultados de pruebas
psicológicas, sea sutil, como ocurre cuando un futuro matemático es aceptado en un curso acelerado
de cálculo con base en sus calificaciones de primer año de bachillerato. De manera más común, los
resultados de las pruebas psicológicas alteran el destino de los individuos en forma profunda. El hecho
de que una persona sea admitida en una universidad y no en otra, que se le ofrezca un empleo pero
que se le rechace en otro, que se le diagnostique o no una depresión, y toda una serie de decisiones
dependen, en parte, del significado de los resultados de las pruebas, tal como los interpretan las
personas con autoridad para ello. En términos sencillos, los resultados de las pruebas psicológicas
cambian vidas. Por esta razón, es prudente (de hecho, casi obligatorio) que los estudiantes de
psicología conozcan los usos y abusos ocasionales contemporáneos de las pruebas.
Por consiguiente, la idea de una prueba es un elemento influyente en nuestra cultura, un aspecto que
damos por sentado. Sin embargo, el concepto que tiene el individuo común de una prueba no
necesariamente coincide con la perspectiva más restrictiva de la psicometría.
Hay psicólogos que se especializan en diseñar y evaluar pruebas psicológicas. Debido a los malos
entendidos generalizados sobre la naturaleza de las pruebas, lo más adecuado es iniciar este tema con
una pregunta fundamental que define el alcance de todo el libro: ¿qué es una prueba?

DEFINICIÓN DE PRUEBA
Una prueba es un procedimiento estandarizado para obtener una muestra de la conducta y describirla
con base en categorías o puntuaciones. Además, la mayoría de las pruebas incluyen normas o
estándares que permiten utilizar los resultados para predecir otras conductas más importantes. En las
siguientes secciones se describen esas características; pero, antes, es conveniente plantear el alcance
de la definición. Según esta perspectiva, existen pruebas tradicionales como cuestionarios de
personalidad e inventarios de inteligencia, aunque la definición también incluye diversos
procedimientos que tal vez el lector no reconozca como pruebas. Por ejemplo, según la definición
utilizada en este libro, todo lo siguiente podría ser una prueba: una lista de cotejo para calificar las
habilidades sociales de un joven con retraso mental; una medida no cronometrada del dominio de
sumar pares de números de tres dígitos; evaluaciones en microcomputadoras del tiempo de reacción;
e incluso pruebas situacionales como observar a un individuo mientras trabaja en una tarea de grupo
con dos “auxiliares” que son obstructivos y poco cooperativos.
En resumen, las pruebas son sumamente variadas tanto en sus formatos como en sus aplicaciones. No
obstante, la mayoría de las pruebas poseen ciertas características que las definen:
• Son procedimientos estandarizados
• Consideran una muestra de la conducta
• Permiten obtener puntuaciones o derivar categorías
• Contemplan normas o estándares
• Predicen conductas no evaluadas
En las siguientes secciones se examina cada una de estas características con mayor detalle. La
descripción que aquí hacemos se refiere especialmente a las pruebas referidas a la norma (pruebas
que utilizan una población de personas bien definida para su interpretación). Sin embargo, las
características definitorias de una prueba difieren ligeramente para el caso especial de las pruebas
referidas al criterio (pruebas que miden lo que una persona puede hacer, en lugar de comparar sus
resultados con los niveles de desempeño de otros individuos). Por esta razón, se incluye un análisis
separado de las pruebas referidas al criterio.
Un procedimiento estandarizado es una característica esencial de cualquier prueba psicológica. Se
considera que una prueba es estandarizada si los procedimientos para aplicarla son uniformes de un
examinador a otro y de una situación a otra. Desde luego, la estandarización depende hasta cierto
punto de las habilidades del examinador.
Incluso la mejor prueba puede resultar inútil si la administra un evaluador descuidado, poco
capacitado o mal informado, como lo descubrirá el lector más adelante en este capítulo. Sin embargo,
la mayoría de los examinadores son competentes. La estandarización, por consiguiente, depende
principalmente de las instrucciones de aplicación que se encuentran en el manual que suele
acompañar a las pruebas.
La formulación de instrucciones es un paso esencial en la estandarización de una prueba para
garantizar procedimientos de administración uniformes, el diseñador de la prueba debe presentar
materiales con estímulos similares a todos los evaluadores, especificar con gran precisión las
instrucciones orales para cada reactivo o subprueba, y aconsejar al examinador sobre la forma de
manejar diversos tipos de dudas por parte del examinado.
Para ilustrar esto, considere las diversas maneras en que el diseñador de una prueba podría enfocar la
evaluación de la retención de dígitos, es decir, el número máximo de dígitos presentados verbalmente
que un sujeto puede recordar de memoria. Una prueba no estandarizada de retención de dígitos podría
sugerir que el examinador presente de manera verbal series cada vez más largas de números hasta
que el sujeto falle. El número de dígitos en la serie más larga recordada sería, por lo tanto, la capacidad
de retención de dígitos del sujeto. La mayoría de los lectores puede darse cuenta de que una prueba
con tal definición tan general carecerá de uniformidad de un examinador a otro. Si el examinador
tiene la libertad de improvisar cualquier serie de dígitos, ¿qué podría impedirle que presentara, con
la inflexión familiar de un locutor de televisión, “1-800-325-3535”? Esta serie sería mucho más fácil
de recordar que un conjunto más aleatorio, por ejemplo, “7-2-8-1-9-4-6-3-7-4-2”. La velocidad de
presentación también puede tener un efecto crucial sobre la uniformidad de una prueba de retención
de dígitos. Para fines de estandarización, es esencial que todos los examinadores presenten cada serie
a una velocidad constante, por ejemplo, un dígito por segundo.
Por último, el examinador necesita saber cómo reaccionar ante respuestas inesperadas, como:
“¿Podría repetir los números de nuevo?”. Como es evidente, la respuesta habitual es “no”.
Una prueba psicológica también es una muestra limitada de conducta. Ni el sujeto ni el examinador
tienen tiempo suficiente para una prueba realmente detallada, incluso cuando esta se dirige a un
dominio conductual bien definido y finito. Así, las restricciones prácticas dictan que una prueba solo
es una muestra de conducta. No obstante, la muestra de conducta es de interés únicamente en la
medida en que permita que el examinador haga inferencias acerca del dominio total de conductas
relevantes. Por ejemplo, el objetivo de una prueba de vocabulario consiste en determinar el repertorio
total de palabras del examinado, al pedir definiciones de una muestra muy pequeña, pero
cuidadosamente seleccionada, de palabras. El hecho de que el sujeto sea capaz de definir las 35
palabras específicas de una subprueba de vocabulario (por ejemplo, en la Escala Wechsler de
Inteligencia para Adultos-IV o WAIS-IV) tiene pocas consecuencias directas. Sin embargo, el
significado indirecto de estos resultados es de gran importancia debido a que señala el conocimiento
general de vocabulario del individuo evaluado.
Un aspecto interesante — del que el público en general tiene escaso conocimiento— es que los
reactivos de prueba no necesitan parecerse a las conductas que esta intenta pronosticar. La
característica esencial de una buena prueba es que permite que el examinador pronostique otras
conductas, y no que refleje aquellas que desea predecir. Si resultara que responder “verdadero” a la
afirmación “bebo mucha agua” ayudara a predecir la depresión, entonces esta afirmación
aparentemente no relacionada sería un índice útil de la depresión. Así, el lector observará que la
predicción exitosa es una cuestión empírica que se resuelve a través de la investigación apropiada.
Aunque la mayoría de las pruebas toman una muestra directa del dominio de conductas que esperan
predecir, esto no constituye un requisito psicométrico.
Una prueba psicológica también debe permitir la derivación de puntuaciones o categorías.
Thorndike (1918) expresó el axioma esencial de las pruebas en su famosa aseveración: “Aquello que
existe de alguna manera, existe en cierta cantidad”. McCall (1939) fue un paso más allá al declarar
que “cualquier cosa que existe en cierta cantidad, puede medirse”. Las pruebas se esfuerzan por ser
una forma de medición similar a los procedimientos de las ciencias físicas, donde los números
representan dimensiones abstractas, como peso o temperatura. Toda prueba arroja una o más
puntuaciones o evidencias de que un individuo pertenece a una categoría y no a otra.
En pocas palabras, las pruebas psicológicas resumen el desempeño en números o clasificaciones. La
suposición implícita del punto de vista psicométrico es que las pruebas miden diferencias individuales
respecto a rasgos o características que existen en cierto sentido vago de la palabra. En la mayoría de
los casos, se supone que los individuos poseen el rasgo o la característica que se mide, aunque en
diferentes cantidades. El objetivo de las pruebas consiste en estimar la cantidad del rasgo o la cualidad
que posee un individuo.
En este contexto, vale la pena mencionar dos advertencias. Primero, toda puntuación de prueba
reflejará siempre cierto grado de error de medición. La imprecisión de las pruebas es inevitable: estas
deben basarse en una muestra externa de conducta para estimar una característica no observable y,
por lo tanto, inferida. Los psicólogos a menudo expresan este aspecto fundamental con la siguiente
ecuación:
X=T+e
Donde X es la puntuación observada, T: es la puntuación verdadera, y e: es el componente de error
positivo o negativo.
Lo mejor que puede hacer un evaluador es procurar que sea muy pequeño. Nunca se puede eliminar
por completo ni tampoco es posible conocer su efecto exacto sobre el caso individual. En el tema 3B,
Conceptos de confiabilidad, se analizará el concepto de error de medición.
La segunda advertencia dirigida a los usuarios de las pruebas es que deben evitar materializar las
características medidas. Los resultados no representan un objeto que tenga realidad física, sino que
suelen representar una abstracción que ha demostrado ser útil para predecir conductas que no se
evalúan. Por ejemplo, al analizar el CI de un individuo, los psicólogos se refieren a una abstracción
que no tiene existencia directa o material, pero que, a pesar de ello, es útil para predecir el rendimiento
escolar y otros resultados.
Una prueba psicológica también debe considerar normas o estándares. Por lo general, la puntuación
de prueba de un individuo se interpreta al compararla con las puntuaciones obtenidas por otros
individuos en la misma prueba. Para ello, los diseñadores de las pruebas comunican normas, es decir,
un resumen de los resultados de la prueba obtenidos en un grupo grande y representativo de individuos
(Petersen, Kolen y Hoover, 1989).
El grupo normativo se conoce como muestra de estandarización. La selección y evaluación de la
muestra de estandarización es crucial para la utilidad de una prueba. Este grupo debe ser
representativo de la población a la que se dirige la prueba o, de otra manera, será imposible determinar
la posición relativa de un sujeto examinado. En el caso extremo de que no se proporcionen normas,
el examinador no podría utilizar los resultados de la prueba en absoluto. Una excepción a esta
característica ocurre en el caso de las pruebas referidas al criterio, las cuales se analizarán más
adelante.
Las normas no solo establecen un desempeño promedio, sino que también sirven para indicar la
frecuencia con la que se obtienen diferentes puntuaciones altas y bajas. Así, las normas permiten que
el examinador determine el grado en que se desvía una puntuación respecto a las expectativas. Esta
información podría ser muy importante para predecir la conducta no evaluada del individuo
examinado. Las normas tienen una importancia tan trascendental en la interpretación de las pruebas,
que se estudiarán con detenimiento en una sección específica de este libro.
Por último, las pruebas no son un fin en sí mismas. En general, el propósito último de una prueba
consiste en predecir conductas adicionales, diferentes a las que se muestran directamente en la
prueba. Así, el examinador podría tener mayor interés en las conductas no evaluadas que la prueba
pronostica, que en las respuestas de la prueba en si Quizás un ejemplo concreto aclarará esto.
Suponga que un examinador aplica una prueba de manchas de tinta a un paciente de un hospital
psiquiátrico, y que el paciente responde a una mancha de tinta describiéndola como “unos ojos que
miran fijamente”. Con base en normas establecidas, el examinador podría predecir que el sujeto será
sumamente suspicaz y que no sería un buen candidato para la psicoterapia individual.
El propósito de las pruebas es llegara esta y otras predicciones similares, y no determinar si la persona
percibe ojos que lo miran fijamente desde las manchas.
La capacidad de una prueba para pronosticar conductas que no se evalúan se determina por un amplio
cuerpo de investigación de validación, cuya mayor parte se realiza después de que la pruébase pública.
Sin embargo, no existen garantías en el mundo de la investigación psicométrica.
Es común que un investigador publique una prueba prometedora y años después se entere de que
otros investigadores la han encontrado deficiente. He aquí una lección para los usuarios de las
pruebas: el hecho de que una prueba exista y afirme medir cierta característica no es garantía de que
esa afirmación sea verdadera. Una prueba puede tener un título llamativo, instrucciones precisas,
normas elaboradas, empaque atractivo y hallazgos preliminares, pero si en el estudio desapasionado
de investigadores independientes la prueba no logra pronosticar conductas apropiadas, entonces es
inútil.

Potrebbero piacerti anche