Sei sulla pagina 1di 82

Tomado para fines educativos y sin intensiones de lucro de:

Kaplan, Robert y Saccuzzo, Dennis. (2006). Pruebas Psicolgicas.


Principios, aplicaciones y temas. Mxico DF: Editorial Thomson.
(Pgs: 1-24 y 611 a 633 y Apndice 5)
Texto mantiene numeracin de pginas y pies tal y como aparecen en el original

CAPITULO 1
Introduccin
OBJETIVOS DE APRENDIZAJE
Al terminar este captulo, usted podr:
Definir los trminos bsicos referentes a las pruebas psicolgicas y educativas
Distinguir entre una prueba individual y una grupal
Definir los trminos desempeo, aptitud e inteligencia e identificar un concepto que
pueda abarcar los tres trminos
Distinguir entre pruebas de habilidades y de personalidad D

Definir el trmino

pruebas estructuradas de personalidad


Explicar cmo difieren las pruebas de personalidad estructuradas de las pruebas
proyectivas
Explicar qu es una muestra normativa estandarizada y por qu es importante
Identificar los principales desarrollos histricos de las pruebas psicolgicas
Explicar la relevancia de las pruebas psicolgicas en la sociedad contempornea.
1
Est sentado en una mesa. Acaban de tomarle las huellas digitales y le piden que
muestre una identificacin con fotografa. Mira a su alrededor y ve a otras 40
personas ms nerviosas que usted. Un supervisor con cronmetro en mano y cara
de pocos amigos se encarga de distribuir los cuadernillos. Poco despus se le
indica que no debe abrirlo hasta recibir la instruccin, ya que de lo contrario podra
ser penalizado. Esto no es una pesadilla ni una fantasa futurista, es la realidad.
Finalmente, despus de lo que parece una eternidad, el supervisor le indica que
abra su cuadernillo en la pgina 3 y comience a trabajar. Su boca est seca y las

palmas de sus manos estn hmedas. Abre el cuadernillo en la pgina 3. Tiene 10


minutos para resolver un problema de cinco puntos con base en la siguiente
informacin:1
Un curioso carrito circula por la arena de un circo y exactamente ocho payasos (Q,
R, S, T, V, W, Y y Z) salen de su interior. El orden en el que salen es el siguiente:
V sale poco antes que Y y Q
Q sale poco despus que Z
T sale poco antes que V pero poco despus que R
S sale poco despus que V
R sale poco antes que W

Pregunta 1. Si Q es el quinto payaso en salir del carro, entonces cada una de las
respuestas siguientes podra ser correcta excepto:
Z es el primer payaso en salir
T es el segundo payaso en salir
V es el tercer payaso en salir
W es el cuarto payaso en salir
Y es el sexto payaso en salir
Sin estar seguro de la respuesta, decide continuar con la siguiente pregunta.

Pregunta 2. Si R es el segundo payaso en salir del carro, cul de las siguientes


respuestas es verdadera?
S sale poco antes que T
T sale poco antes que W
W sale poco antes que V
Y sale poco antes que Q
Z sale poco antes que W
Su corazn late un poco ms rpido y su mente comienza a congelarse como una
computadora sobrecargada. Mira su reloj y nota que ya han transcurrido dos
minutos y an no tiene sus respuestas. La persona que est junto a usted se ve un
poco plida. Tres filas adelante alguien discute con el supervisor y reclama

acaloradamente que no puede resolver ese tipo de problemas. Mientras el


supervisor lucha para calmar a cada persona, otra hace una carrera loca al bao.
2
Bienvenido al mundo de las pruebas psicolgicas estandarizadas, competitivas y
de "alto riesgo" del siglo XXI. Las preguntas que usted acaba de leer son
problemas reales de una versin anterior del LSAT, el Law School Admissin Test
(Prueba de Admisin a la Escuela de Leyes). El que un estudiante ingrese o no a
la escuela de leyes en Estados Unidos est determinado, casi por completo, por la
puntuacin que obtiene en el LSAT, as como por el promedio de calificaciones del
nivel acadmico anterior. Por lo tanto, el futuro de una persona puede depender
en gran medida de la calificacin obtenida en una sola prueba que se presenta en
una tarde o una maana cargada de tensin. Problemas similares aparecen en el
GRE, Gradate Record Exam, una prueba que juega un papel preponderante para
determinar quin puede estudiar una carrera universitaria en Estados Unidos.
(Ms adelante en este libro se discutir cmo prepararse para tales pruebas y su
importancia o validez predictiva).
Evaluaciones como el LSAT y el GRE son las pruebas psicolgicas modernas ms
difciles que existen en la actualidad. Las escenas que hemos descrito son reales;
algunas carreras dependen de una sola prueba. Quizs usted ya ha presentado el
GRE o el LSAT o quizs an no se ha graduado pero est pensando en presentar
una solicitud para hacer una carrera universitaria o un programa profesional y
pronto se enfrentar al GRE, al LSAT o al MCAT (Medical College Admissin
Test). Seguramente, le ser de utilidad tener un conocimiento bsico de la multitud
de pruebas psicolgicas que se le pide a la gente que presente a lo largo de su
vida.
Desde que nacemos, las pruebas tienen una gran influencia en nuestras vidas.
Cuando el pediatra golpea las palmas de nuestras manos y las plantas de
nuestros pies, est realizando una prueba. Cuando entramos a la escuela, las
pruebas deciden si aprobamos o reprobamos. Las pruebas pueden determinar si
necesitamos educacin especial. Existe un movimiento para llevar a cabo pruebas

de competencia con el fin de determinar si los estudiantes se graduarn de


preparatoria (Gutloff, 1999; Jacob, 2001; Liu, Spicuzza y Erickson, 1999; Mehrens,
2000; Shimmel y Langer, 2001). Otras pruebas determinan a qu universidad
podemos entrar. Y, por supuesto, cuando ingresamos a la universidad seguimos
enfrentando ms pruebas.
Despus de graduarse, aquellos que eligieron evitar pruebas como el GRE, puede
que necesiten presentar otras pruebas para determinar en dnde trabajarn. En el
mundo moderno, gran parte de la vida de cada persona y el xito que se obtiene
dependen de los resultados de pruebas. De hecho, las pruebas tienen una
importancia internacional.
Por ejemplo, la Organizacin para la Cooperacin y el Desarrollo Econmico
(OCDE) y el Programa Internacional para la Evaluacin de Estudiantes (PISAX
Schleicher y Tamassia, 2000), aplicaron a jvenes de 15 aos de 32 pases una
serie de problemas como el siguiente:
Uno de los resultados del calentamiento global es que el hielo de algunos
glaciares se est derritiendo.
Doce aos despus de que el hielo desaparece, diminutas plantas,
llamadas liqenes, comienzan a crecer en las rocas. Cada liquen crece ms
o menos en forma de crculo.
La relacin entre el dimetro de los crculos y la edad del liquen pueden
calcularse con la frmula: d = 7.0 X la raz cuadrada de (t 12) para
cualquier menor o igual a 12, donde d representa el dimetro del liquen en
milmetros y t representa el nmero de aos despus de que el hielo ha
desaparecido.
3

Calcule el dimetro del liquen 16 aos despus de haber desaparecido el hielo. La


respuesta correcta y completa es:
d = 7.0 X raz cuadrada de (16 12 mm) d

= 7.0 X raz cuadrada de 4 mm d

= 14 mm
Dieciocho pases se situaron por arriba de Estados Unidos en el porcentaje de
jvenes de 15 aos que dominaron tales conceptos (vase figura 1-1).
Los resultados fueron similares para la prueba de conocimientos en ciencias de la
OCDE (vase figura 1-2), que tena preguntas como la siguiente:

Un autobs circula por un tramo recto de carretera. El conductor, llamado


Ray, lleva una taza con agua en un portavasos del tablero. De repente Ray
tiene que frenar bruscamente. Qu tiene ms probabilidades de ocurrirle al
agua de la taza inmediatamente despus de que Ray frena?
4

A.

El agua permanecer horizontal

B.

El agua se derramar hacia el lado 1

C.
D.

El agua se derramar hacia el lado 2


El agua se derramar pero no es posible asegurar si ser hacia el lado 1 o

hacia el lado 2
La respuesta correcta es C.
Qu tan tiles son las pruebas como estas? Miden algo significativo? Qu tan
precisas son? Tales preguntas preocupan no slo a cada estadounidense, sino a
todos los miembros de una comunidad internacional altamente competitiva. Para
responderlas, debe entender los principios de las pruebas en psicologa que est a
punto de aprender.
Para responder preguntas relativas a las pruebas, debe entender los conceptos
que se presentan en este libro, como confiabilidad, validez, anlisis de reactivos y
construccin de pruebas. Para lograr una comprensin satisfactoria de
5

estos conceptos requerir un estudio cuidadoso de estadstica bsica, pero sus


esfuerzos se vern recompensados, ya que al terminar este libro podr utilizar mejor las pruebas.

Conceptos bsicos
Probablemente est familiarizado con algunos de los conceptos elementales de
las pruebas psicolgicas. Sin embargo, para efectos de claridad comenzaremos
con las definiciones de los conceptos bsicos, de modo que pueda conocer de qu
forma son utilizados en este texto.

Qu es una prueba?
Todo el mundo ha tenido alguna experiencia con pruebas. Una prueba es un instrumento o tcnica de medicin utilizada para cuantificar el comportamiento o
ayudar a entender y predecir la conducta. Una prueba de ortografa, por ejemplo,
evala qu tan bien alguien puede deletrear o hasta qu grado alguien ha
aprendido a deletrear una lista especfica de palabras. En algn momento durante

las semanas siguientes, es probable que su profesor quiera evaluar qu tan bien
ha aprendido usted el material de este libro. Para lograrlo, el profesor puede aplicarle una prueba.
Como bien sabe, la prueba que se aplique puede no medir su comprensin total
del material. Esto es porque una prueba mide nicamente una muestra del
comportamiento y el error siempre est asociado al proceso de muestreo. Las calificaciones de una prueba no son mediciones perfectas de una conducta o una
caracterstica, pero son significativas en el proceso de prediccin, como se ver.
Un reactivo es un estmulo especfico al que responde una persona abiertamente;
esta respuesta puede ser calificada o evaluada (por ejemplo, clasificada, ubicada
en una escala o contabilizada). Debido a que las pruebas psicolgicas y
educativas se conforman de reactivos, los datos que se obtienen son explcitos y
por lo tanto, sujetos a investigacin cientfica.
En trminos simples, los reactivos son las preguntas o problemas especficos que
componen la prueba. Los problemas presentados al principio de este captulo son
ejemplos de los reactivos de una prueba. La respuesta manifiesta consiste en
llenar uno de los espacios:

Una prueba psicolgica o educativa es un conjunto de reactivos diseados para


medir caractersticas del comportamiento de las personas. Hay muchos tipos de
conducta. La conducta manifiesta es la actividad observable de un individuo.
Algunas pruebas psicolgicas intentan medir el grado en el que una persona
podra mostrar o "emitir" una conducta manifiesta particular. Otras pruebas miden
el grado en que se present en el pasado una conducta manifiesta. La con6
ducta tambin puede ser encubierta, es decir, se da dentro del individuo y no se
puede observar directamente. Por ejemplo, nuestros sentimientos y pensamientos
son tipos de conducta encubierta. Algunas pruebas intentan medir tal conducta.

Las pruebas psicolgicas y educativas, por lo tanto, miden la conducta actual o la


pasada. Algunas tambin intentan predecir la conducta futura, como el xito en la
universidad o en un programa de posgrado.
Qu significa cuando alguien obtiene 75 reactivos correctos en una prueba de
100? Uno de los significados, por supuesto, es que el 75% de los reactivos fueron
contestados correctamente. En muchas situaciones, sin embargo, el porcentaje de
reactivos correctos que obtiene una persona puede ser engaoso. Considere dos
ejemplos extremos. En un caso, de 100 estudiantes que presentaron el examen,
99 obtuvieron 90% o ms de respuestas correctas y uno obtuvo el 75% de
respuestas correctas. En otro caso, 99 de 100 estudiantes obtuvieron
calificaciones de 25% o menos y uno obtuvo 75% de respuestas correctas. El
significado de las calificaciones puede ser totalmente diferente, dependiendo de la
distribucin de los individuos de la muestra. En el primer caso, la calificacin de
75% es mala ya que se encuentra en la parte ms baja de la distribucin; en el
segundo caso, el 75% es en efecto la calificacin ms alta. Para resolver tales
problemas de interpretacin, los psiclogos hacen uso de escalas, las cuales
relacionan las puntuaciones brutas de los reactivos de una prueba con alguna
distribucin terica o emprica definida. En captulos posteriores aprender acerca
de estas distribuciones.
Las puntuaciones de las pruebas pueden estar relacionadas con rasgos, los
cuales son tendencias a responder de una cierta manera. La "determinacin", en
ocasiones vista como "terquedad", es un ejemplo de rasgo; la "timidez" es otro.
Las puntuaciones de las pruebas tambin pueden estar relacionadas con el estatus, o la condicin de un individuo en particular. Por ejemplo, una determinada
persona, despus de varios contratiempos puede, encontrarse en un estado de
debilidad y por lo tanto, sentirse menos inclinada que de costumbre a manifestar
su determinacin. Las pruebas miden varios tipos de comportamiento.

Tipos de pruebas
As como existen varios tipos de comportamiento, tambin hay varios tipos de
pruebas. Aquellas que slo pueden aplicarse a una persona a la vez se conocen

como pruebas individuales (vase figura 1-3). El examinador evala a una


persona a la vez, de la misma forma que lo hace un psicoterapeuta. Una prueba
grupal, en contraste, puede aplicarse a varias personas al mismo tiempo por un
solo examinador, como cuando un profesor aplica un examen a todos los alumnos
de su clase.
Tambin es posible clasificar las pruebas de acuerdo con el tipo de conducta que
van a evaluar. Las pruebas de habilidades contienen reactivos que pueden ser
calificados en trminos de velocidad, precisin o ambas. En una prueba de
habilidades, entre ms rpidas o precisas sean sus respuestas, mejores sern sus
puntuaciones en un rea en particular. Entre ms problemas de lgebra resuelva
correctamente en un tiempo determinado, ms alta ser su calificacin en esa
aptitud.
Histricamente, los expertos han distinguido entre desempeo, aptitud e inteligencia como tipos de habilidades diferentes. El desempeo se refiere al
7

aprendizaje previo. Una prueba que mide o evala cuntas palabras pueden ser
deletreadas correctamente se denomina prueba de desempeo en ortografa. La
aptitud, en contraste, se refiere al potencial para aprender o adquirir una capacidad especfica. Una prueba de aptitud en ortografa mide cuntas palabras es
capaz de deletrear despus de cierto entrenamiento, educacin y experiencia. Su
aptitud musical se refiere en parte a qu tan bien podra aprender a tocar un instrumento musical despus de recibir un cierto nmero de lecciones. Tradicionalmente diferenciada del desempeo y la aptitud, la inteligencia se refiere al
potencial general de una persona para resolver problemas, adaptarse a situaciones cambiantes, pensar en forma abstracta y beneficiarse de la experiencia. Cuando decimos que una persona es "lista", por lo general nos referimos a la
inteligencia. Cuando un padre regaa a su hija porque no ha dado su mejor esfuerzo en la escuela, lo ms probable es que crea que ella no ha utilizado su inteligencia (potencial general) para adquirir nuevos conocimientos.
Las diferencias entre desempeo, aptitud e inteligencia no siempre son definidas,
ya que las tres estn estrechamente relacionadas. Por ejemplo, los intentos por
separar el aprendizaje previo del potencial para aprender no han tenido xito. En
vista de esta superposicin, los tres conceptos se encierran en el trmino habilidad
humana.
Existe una clara distincin entre las pruebas de habilidades y las de personalidad.
Mientras que las primeras tienen que ver con la capacidad o potencialidad, las
pruebas de personalidad se relacionan con los recursos manifiestos y encubiertos
del individuo, como por ejemplo la tendencia de una persona a mostrar un
comportamiento o respuesta particular en una situacin determinada. Permanecer
aislado de los dems, por ejemplo, no requiere ninguna capacidad o habilidad
especial, pero algunas personas prefieren o tienden a permanecer aisladas. Las
pruebas de personalidad miden el comportamiento caracterstico.
8

Existen varios tipos de pruebas de personalidad. En el captulo 13 aprender


acerca de las pruebas de personalidad estructuradas u objetivas. Las pruebas
estructuradas de personalidad proporcionan un enunciado, por lo general del tipo
de autoinforme y solicitan a la persona examinada que elija entre dos o ms
respuestas alternativas como "verdadero" o "falso" (vase figura 1-4).
A diferencia de las pruebas de personalidad estructuradas, las proyectivas no son
estructuradas. En una prueba proyectiva de personalidad, ya sea el estmulo
(materiales de la prueba) o la respuesta requerida, o ambos, son ambiguos. Por
ejemplo, en la controvertida prueba de Rorschach, el estmulo es una mancha de
tinta. Asimismo, en lugar de pedir que se elija entre respuestas alternativas, como
en las pruebas estructuradas, se le solicita a la persona examinada que d una
respuesta espontnea. La mancha de tinta se le presenta a la persona y se le pregunta: "qu podra ser esto?". En las pruebas proyectivas se entiende que la
interpretacin que la persona hace de un estmulo ambiguo define sus
caractersticas de manera unvoca. (Vase captulo 14.)
En la tabla 1-1 se presenta una breve perspectiva de las pruebas de habilidad y de
personalidad.
Las evaluaciones psicolgicas se refieren a todos los posibles usos, aplicaciones y
conceptos que subyacen a las pruebas psicolgicas y educativas. Sin embargo, el
objetivo principal de este tipo de pruebas es evaluar las diferencias individuales.
Estas pruebas miden adems las variaciones entre los individuos en habilidad y
personalidad, suponiendo que tales diferencias son reales. Por ejemplo, se da por

hecho que los individuos con un coeficiente intelectual alto tienen un grado de
inteligencia superior que aquellos con puntuaciones bajas. Por lo tanto, el
propsito ms importante de las pruebas es establecer las diferencias

TABLA 1-1 Tipos de pruebas

Pruebas de habilidades: miden las competencias en trminos de velocidad,


precisin o ambas.
A. Desempeo: miden el aprendizaje previo.
B. Aptitudes: miden el potencial para adquirir una habilidad especfica.
C.

Inteligencia: miden el potencial para resolver problemas, adaptarse a

situaciones cambiantes y beneficiarse de la experiencia.


Pruebas de personalidad: miden el comportamiento caracterstico: rasgos,
temperamento y recursos.
A.

Estructurada (objetiva): La persona que responde a los enunciados

"Verdadero" o "Falso", "Si" o "No" proporciona un autoinforme.


B.

Proyectiva: Proporciona un estmulo ambiguo; los criterios de respuesta no

son claros entre quienes responden la prueba. Ms adelante en este captulo se


discutir la idea de las diferencias individuales.
9
Perspectiva general del libro
Este libro se divide en tres partes: Principios, Aplicacin y Discusin. En conjunto,
estas tres partes abarcan la evaluacin psicolgica, desde las ideas bsicas hasta
las ms complejas. Las ideas bsicas y las situaciones se presentan desde el
principio y se enfatizan a lo largo del texto para reforzar lo que se ha aprendido. Al
cubrir los principios, la aplicacin y la discusin se intenta presentar no slo los
quines en las pruebas psicolgicas, sino tambin el cmo y el por qu de los
principales desarrollos en el campo. El contenido de esta obra atiende tambin
una preocupacin importante para muchos estudiantes cuando revisan los diversos usos y resultados de las pruebas: la relevancia de stas,

Principios de las pruebas psicolgicas


Cuando hablamos de los principios de la evaluacin psicolgica nos referimos a
los conceptos bsicos e ideas fundamentales que subyacen a todas las pruebas
psicolgicas y educativas. Los captulos 2 y 3 presentan conceptos estadsticos
que proporcionan las bases para entender las pruebas. Los captulos 4 y 5 abordan dos de los conceptos ms importantes en las pruebas: confiabilidad y validez.
La confiabilidad se refiere a la exactitud, confianza, consistencia o posibilidad de
que los resultados de una prueba se repitan. En trminos ms tcnicos, la confiabilidad se refiere al grado en que las puntuaciones de una prueba estn libres
de errores de medicin. Como lo comprobar ms adelante, la confiabilidad de
una prueba puede obtenerse de diferentes maneras y existen muchas formas en
que una prueba puede ser confiable. Por ejemplo, los resultados pueden ser confiables a travs del tiempo, lo que significa que si la prueba se aplica dos veces en
un intervalo de tiempo determinado, los resultados tienden a ser iguales o muy
similares. La validez se refiere al significado y utilidad de los resultados de una
prueba. Especficamente, la validez de una prueba se refiere al grado en que una
determinada inferencia o la interpretacin en que se basa es apropiada. Cuando
se hace la pregunta: "qu mide esta prueba psicolgica?" lo que realmente se
est preguntando es "para qu atributo es vlida esta prueba?"
Otro principio de las pruebas psicolgicas se refiere a la elaboracin de una
prueba que se presenta en el captulo 6. Los aspectos relativos a la administracin
de pruebas, es el tema principal del captulo 7. Aunque algunas pruebas son
fciles de administrar, otras requieren una alta especializacin. El captulo final de
la parte 1 (principios) abarca los fundamentos para administrar una prueba
psicolgica.

Aplicacin de las pruebas psicolgicas


La parte 2, relativa a la aplicacin, proporciona un anlisis detallado de las
pruebas ms populares, de su aplicacin y utilidad. Inicia con una perspectiva

general de los conceptos esenciales que se relacionan con la aplicacin de


pruebas. El captulo 8 analiza las tcnicas de entrevista. La entrevista como

10
un mtodo para obtener informacin mediante preguntas directas en la interaccin
verbal. Tradicionalmente, la entrevista no slo ha servido como la tcnica principal
para obtener informacin psicolgica en general, sino que los datos obtenidos
proporcionan un importante complemento para los resultados de las pruebas.
Los captulos 9 y 10 describen las pruebas individuales de habilidades humanas.
En estos captulos se aprender no slo de las pruebas, sino tambin acerca de
las teoras de la inteligencia que subyacen a ellas. En el captulo 11 se trata el
tema de las pruebas en la educacin, con nfasis en la educacin especial. En el
captulo 12 se presentan las pruebas grupales de habilidades humanas. El
captulo 13 aborda las pruebas estructuradas de personalidad y el captulo 14 las
proyectivas. En el captulo 15 se analiza el importante papel de las computadoras
en el campo de las pruebas. Tambin se considera la influencia de la psicologa
cognoscitiva, que actualmente es la ms destacada entre las diversas escuelas
del pensamiento psicolgico (Kellog, 2003; Leahy y Dowd, 2002; Weinstein y Way,
2003).
Estos captulos no solo proporcionan informacin descriptiva, sino que tambin
abundan en ideas subyacentes a las diversas pruebas. El captulo 16 revisa el
rea relativamente nueva de las pruebas mdicas para detectar dao cerebral y el
estado de salud. Asimismo, trata los ms recientes e importantes avances en el
desarrollo de la neurofisiologa. El captulo 17 examina las pruebas de intereses,
que miden las preferencias ocupacionales. Finalmente, el captulo 18 presenta las
pruebas en psicologa industrial y organizacional, y de negocios.

Discusin sobre las pruebas psicolgicas


Son muchas las controversias sociales y tericas que acompaan a las pruebas,
como es el tema de las diferencias raciales implicadas en las pruebas de habilidades. La parte 3 presenta muchos de estos aspectos.
La cobertura del libro proporciona un punto intermedio entre los alcances y las
limitaciones de las pruebas en el mbito profesional, social y poltico actual.
El captulo 19 analiza el tema de los sesgos en las pruebas, uno de los aspectos
ms voltiles en el campo actualmente (Fox, 1999; Geisinger, 2003; Reynolds y
Ramsay 2003; Ryan y DeMark, 2002). Ya que las pruebas psicolgicas han sido
sealadas de ser discriminatorias o tendenciosas con ciertos grupos, este captulo
pone especial atencin en ambos lados del debate. Debido a las acusaciones de
sesgos y otros problemas, las pruebas psicolgicas estn siendo cada vez ms investigadas por la ley (Phillips, 2002; Saccuzzo, 1999). El captulo 20 examina el
sesgo de las pruebas, su relacin con aspectos legales y analiza la evaluacin en
mbitos periciales. El captulo 21 presenta una perspectiva general de otros aspectos que definen el futuro de las pruebas psicolgicas en Estados Unidos, con
nfasis en el tema de la tica. A partir de la revisin de estos aspectos, tambin se
especula acerca del futuro de las pruebas psicolgicas.

PERSPECTIVA histrica
Se expondr brevemente el contexto histrico de las pruebas psicolgicas. El anlisis tocar algunos de los materiales presentados al principio de este captulo.
11
Antecedentes
La mayora de los principales desarrollos en pruebas psicolgicas han tenido lugar
durante el ltimo siglo, muchos de ellos en Estados Unidos. Sin embargo, los
orgenes de estas pruebas, ni son recientes ni estadounidenses. La evidencia sugiere que los chinos tenan un programa de pruebas de servicio civil relativamente
sofisticado desde hace ms de 4 000 aos (DuBois, 1970, 1972). En China se

aplicaban exmenes orales cada tres aos para ayudar a determinar las
evaluaciones laborales y las decisiones de promocin.
En tiempos de la Dinasta Han (206 A.C. a 220 D.C.), era bastante comn el uso
de las bateras de pruebas (dos o ms pruebas utilizadas conjuntamente). Estas
primeras pruebas estaban relacionadas con tpicos tan diversos como derecho
civil, asuntos militares, agricultura, ingresos fiscales y geografa. Las pruebas
alcanzaron un buen desarrollo durante la Dinasta Ming (1368-1644 D.C.). En este
periodo, un programa nacional de pruebas con mltiples etapas incorpor centros
regionales y locales los cuales tenan casillas especiales y equipadas para la
aplicacin de las pruebas. Aquellos que obtenan resultados satisfactorios a nivel
local, iban a las capitales de provincia para realizar exmenes ms extensos tipo
ensayo.
Despus de esta segunda prueba, aquellos con las calificaciones ms altas iban a
la capital del pas para una ronda final. nicamente los que pasaban este tercer
conjunto de pruebas eran elegidos para un oficio pblico.
Es muy probable que el mundo occidental aprendiera acerca de estos programas
de pruebas gracias a los chinos. Los informes de los misioneros y diplomticos
britnicos motivaron a la English East India Company en 1832 a copiar el sistema
chino como un mtodo para seleccionar empleados para el servicio exterior. Una
vez que los programas funcionaron bien en la compaa, el gobierno britnico
adopt, en 1855, un sistema de pruebas similar para su servicio civil.
Despus del aval britnico para dicho sistema, los gobiernos francs y alemn
hicieron lo mismo. En 1883, el gobierno de Estados Unidos estableci la American
Civil Service Commission, la cual desarroll y administr exmenes de
competitividad para ciertos puestos gubernamentales. El mpetu del movimiento
de evaluacin en el mundo occidental creci rpidamente en esa poca (Wig-gins,
1973).

Charles Darwin y las diferencias individuales


Quizs el concepto ms elemental que subyace a las pruebas psicolgicas y educativas pertenece a las diferencias individuales. No hay dos copos de nieve idnticos, ni dos huellas digitales iguales. De forma similar, no hay dos personas
exactamente iguales en habilidades y comportamiento caracterstico. Como se ha
visto, las pruebas estn especficamente diseadas para medir estas diferencias
individuales en habilidades y personalidad.
Aunque los seres humanos descubrieron desde hace mucho tiempo que los
individuos son diferentes, desarrollar las herramientas para medir tales diferencias
no fue tarea fcil. Para desarrollar un instrumento de medicin, debemos entender
qu es lo que queremos medir. Un paso importante para comprender las
diferencias individuales se dio bajo la influencia del libro de Charles Darwin, El
Origen de las Especies en 1859. De acuerdo con esta teora, las formas de vida
superiores evolucionaron parcialmente debido a las diferencias dentro de las
especies. Dado que los individuos de una especie son diferentes, algunos poseen

12

caractersticas de mayor adaptabilidad o ms exitosas para un determinado ambiente que otros. Darwin tambin crea que aquellos con las mejores caractersticas o mayor adaptabilidad sobreviven a expensas de los menos aptos, y los que
sobreviven heredan sus caractersticas a la siguiente generacin. Mediante este
proceso, afirm, la vida ha ido evolucionando hasta sus niveles de complejidad e
inteligencia actuales.
Sir Francis Galton, pariente de Darwin, pronto empez a aplicar las teoras del
naturalista para el estudio de los seres humanos (vase figura 1-5). Dados los
conceptos de supervivencia del ms apto y de las diferencias individuales, Galton
demostr que algunas personas poseen caractersticas que las hacen ms aptas
que otras, una teora que expuso en su libro Hereditary Genius, publicado en
1869. Posteriormente, Galton (1883) inici una serie de estudios experimentales
para documentar la validez de su posicin. Se concentr en demostrar que las diferencias individuales existen en el funcionamiento sensorial y motor del ser humano, como el tiempo de reaccin, la agudeza visual y la fuerza fsica. Al hacerlo,
Galton inici una bsqueda de conocimiento acerca de las diferencias individuales
del hombre, lo que es ahora uno de los campos ms importantes de la psicologa
cientfica.
El trabajo de Galton fue ampliado por el psiclogo estadounidense James McKeen
Cattell, quien acu el trmino prueba mental (Cattell, 1890). La disertacin
doctoral de Cattell se bas en el trabajo de Galton sobre las diferencias individuales en el tiempo de reaccin. De esta manera, Cattell perpetu y estimul
las fuerzas que finalmente llevaron al desarrollo de las pruebas modernas.

Psicologa experimental y medicin psicofsica


Un segundo fundamento de importancia en lo que respecta a las pruebas puede
encontrarse en la psicologa experimental y en los primeros intentos para desentraar los misterios de la conciencia humana mediante el mtodo cientfico. Antes
de que la psicologa, fuera practicada como ciencia, se desarrollaron los modelos
matemticos de la mente, en particular los de J.E. Herbart. Herbart finalmente
utiliz estos modelos como la base de las teoras educativas que tuvieron gran

influencia en las prcticas educativas del siglo XIX. Siguiendo los conceptos de
Herbart, E.H. Weber intent demostrar la existencia de un umbral
13
psicolgico, el estmulo mnimo necesario para activar un sistema sensorial. Posteriormente, siguiendo las ideas de Weber, G.T. Fechner concibi la ley de que la
fuerza de una sensacin crece como logaritmo de la intensidad del estmulo.
Al psiclogo Wilhelm Wundt, quien estableci un laboratorio en la Universidad de
Leipzig en 1879, se le acredita haber fundado la ciencia de la psicologa, apoyado
en la tradicin de Weber y Fechner (Hearst, 1979). Wundt fue sucedido por E.B.
Titchner, cuyo discpulo, G. Whipple, reclut a L.L. Thurstone. Whipple
proporcion las bases para los grandes cambios que se produjeron en el campo
de las pruebas al llevar a cabo un seminario en el Instituto Carnegie en 1919, al
que asistieron Thurstone, E. Strong y otros destacados psiclogos pioneros estadounidenses. De este seminario surgi el Inventario de Intereses de Carnegie
(Carnegie Interest Inventory) y posteriormente el Inventario de Intereses
Vocacionales de Strong (Strong Vocational Interest Blank). Ms adelante en este
libro se analizar en detalle el trabajo de estos pioneros y las pruebas que
ayudaron a desarrollar. En conclusin, las pruebas psicolgicas se desarrollaron a
partir de por lo menos dos lneas de investigacin: una basada en el trabajo de
Darwin, Galton y Cattell acerca de la evaluacin de las diferencias individuales, y
la otra (tericamente ms relevante y posiblemente ms fuerte) basada en el t
abajo de los psicofsicos alemanes Herbart, Weber, Fechner y Wundt. La
psicologa experimental se desarroll a partir de este ltimo. De este trabajo
tambin surgi la idea de que las pruebas psicolgicas, al igual que un
experimento, requieren de un riguroso control experimental. Dicho control, como
se ver, surge de administrar pruebas bajo condiciones altamente estandarizadas.
Los esfuerzos de estos investigadores, por constantes y sistemticos que hayan
sido, no lograron por s mismos la creacin de las pruebas psicolgicas modernas.
Estas pruebas surgieron tambin en respuesta a necesidades importantes como la
clasificacin e identificacin de las discapacidades mentales y emocionales. Una

de las primeras pruebas que ms se asemeja a los mtodos actuales, es el Seguin


Form Board Test (Seguin, 1866/1907), la cual fue desarrollada como un esfuerzo
para educar y evaluar a los discapacitados mentales. De forma similar, Kraepelin
(1912) cre una serie de exmenes para evaluar a las personas emocionalmente
afectadas.
Un avance importante en la creacin de las pruebas modernas tuvo lugar a
comienzos del siglo XX. El ministro francs de educacin pblica nombr una
comisin para estudiar formas que llevaran a identificar a individuos intelectualmente subnormales con el fin de proporcionarles oportunidades educativas apropiadas. Uno de los miembros de la comisin era Alfred Binet. En un trabajo
conjunto con el mdico francs T. Simn, Binet desarroll la primera prueba significativa de inteligencia general. El esfuerzo pionero de Binet fue el primer intento
sistemtico por evaluar las diferencias individuales en la inteligencia humana
(vase captulo 9).

Evolucin de los pruebas de inteligencia y las pruebas estandarizadas de


desempeo
La historia y evolucin de la prueba de inteligencia de Binet es ilustrativa al respecto. La primera versin de la prueba, conocida como la Escala Binet-Simon, fue
publicada en 1905. El instrumento contena 30 reactivos en orden de dificultad
creciente y fue diseado para identificar a los individuos intelectualmente subnormales. Como cualquier prueba bien estructurada, la Escala Binet-Simon de 1905
14
increment su muestra de estandarizacin. Esta muestra consisti en 50 nios a
los que se les administr la prueba bajo condiciones estndar esto es,
exactamente las mismas instrucciones y el mismo formato. Al obtener la
estandarizacin con esta muestra, los autores de la prueba Binet tuvieron normas
con las cuales podan comparar los resultados de cualquier sujeto nuevo. Sin
dichas normas, hubiera sido difcil, si no es que imposible, evaluar el significado de
las puntuaciones. Sin embargo, al conocer elementos como el nmero promedio

de respuestas correctas encontradas en la muestra estandarizada, sera posible


por lo menos establecer si un nuevo sujeto se encontraba por arriba o por debajo
de la misma.
Es fcil entender la importancia de la muestra con la que se va a estandarizar la
prueba. Sin embargo, la importancia de obtener una muestra que represente a la
poblacin para la cual ser utilizada una prueba, en ocasiones ha sido ignorada o
pasada por alto (Malreaux, 1999). Por ejemplo, si una muestra estandarizada se
compone de 50 hombres blancos de familias adineradas, entonces no se puede
evaluar fcilmente o con equidad a una mujer joven afroamericana de una familia
pobre. No obstante, en ocasiones se hacen comparaciones de este tipo.
Evidentemente, no es apropiado comparar a un individuo con un grupo que no
tiene las mismas caractersticas que l (Garca y Fleming, 1998).
Binet estaba consciente de la necesidad de contar con una muestra estandarizada. El desarrollo posterior de la prueba de Binet incluy la posibilidad de incrementar el tamao y representatividad de la muestra estandarizada. Una
muestra representativa es aquella que agrupa individuos similares a aquellos con
los que se va a utilizar la prueba. Cuando sta se usa para la poblacin general,
una muestra representativa debe reflejar todos los segmentos de la poblacin en
proporcin a sus nmeros reales.
Hacia 1908, la Escala Binet-Simn haba sido significativamente mejorada. Fue
revisada y se incluyeron cerca del doble de reactivos que tenia la escala de 1905.
Un hecho an ms importante fue que el tamao de la muestra estandarizada se
increment a ms de 200 personas. La Escala Binet-Simn de 1908 tambin
determin la edad mental de los nios, con lo cual se introdujo un concepto
histricamente significativo. En trminos simples, se podra pensar en la edad
mental como una medida del desempeo de un nio en una prueba con respecto
a otros de edad similar. Si el desempeo de un nio en una prueba es igual al
promedio de los nios de ocho aos, por ejemplo, entonces su edad mental es de
ocho aos. En otras palabras, en trminos de las habilidades medidas en esta
prueba, el nio puede ser considerado como poseedor de un nivel de habilidad
similar al promedio de nios de ocho aos. La edad cronolgica del nio puede ser

de cuatro o doce aos, pero en trminos del desempeo en una prueba, el nio
funciona al mismo nivel que el promedio de ocho aos. El concepto de edad
mental fue una de las contribuciones ms importantes de la revisin de la Escala
Binet-Simon realizada en 1908.
En 1911, la Escala Binet-Simon tuvo una revisin menor. En ese tiempo, la idea
de las pruebas de inteligencia fue absorbida en todo el mundo. Hacia 1916 L.M.
Teman, de la Universidad de Stanford, haba revisado la prueba de Binet para
aplicarla en Estados Unidos. La revisin de Terman, conocida como la Escala de
Inteligencia Stanford-r Binet (Terman, 1916), fue la nica versin estadounidense
de la prueba de Binet que prosper. Esta revisin tambin caracteriza una de las
tendencias ms importantes con respecto a la evaluacin psicolgica el impulso
hacia mejores pruebas.
15
La revisin de 1916 de Teman de la Escala Binet-Simon inclua muchas modificaciones. La muestra de estandarizacin se increment a 1000 personas, se
revisaron los reactivos originales y se incluyeron otros nuevos. La Escala de Inteligencia Stanford-Binet elaborada por Teman en 1916 le aadi respetabilidad y
fuerza al movimiento de pruebas que iniciaba su desarrollo.
Primera Guerra Mundial. El movimiento de las pruebas psicolgicas tuvo un
enorme crecimiento en Estados Unidos debido a la demanda de una forma
eficiente y rpida de evaluar el funcionamiento emocional e intelectual de miles de
reclutas en la Primera Guerra Mundial. La guerra cre una demanda de pruebas
grupales a gran escala ya que relativamente poco personal capacitado poda
evaluar el enorme flujo de reclutas militares. Sin embargo, la prueba de Binet era
un mtodo de evaluacin individual.
Poco despus de que Estados Unidos particip activamente en la Primera Guerra
Mundial, el ejrcito solicit la ayuda de Robert Yerkes, quien entonces era
presidente de la American Psychological Association (vase Yerkes, 1921). Yerkes encabez un comit de distinguidos psiclogos que rpidamente desarrollaron
dos pruebas grupales estructuradas de habilidades humanas: el Army Alpha y el

Army Beta. El Army Alpha requera que quien lo contestara supiera leer, mientras
que el Arrny Beta meda la inteligencia de adultos analfabetas.
La Primera Guerra Mundial alent el desarrollo generalizado de las pruebas
grupales. Por este tiempo, el nmero de pruebas se ampli para incluir tambin
pruebas de desempeo, aptitudes, intereses y personalidad. Ya que las pruebas
de desempeo, de aptitudes y de inteligencia se superponan de tal forma, las diferencias entre ellas eran ms ilusorias que reales. An as, la Escala de Inteligencia de Stanford Binet de 1916 haba surgido en un momento de gran demanda y
optimismo para medir el potencial del comportamiento humano. La Primera Guerra
Mundial y la creacin de pruebas grupales dieron un nuevo impulso al movimiento
de las pruebas. Poco despus de la aparicin de la Escala de Inteligencia
Stanford-Binet de 1916 y de la prueba Army Alpha, las escuelas, las universidades
y la industria comenzaron a usarlas. Para muchos las pruebas psicolgicas como
nuevo fenmeno, era la clave para resolver problemas que surgan a raz del
rpido crecimiento de la poblacin y la tecnologa.

Pruebas de desempeo.
Entre los desarrollos ms importantes que siguieron en la Primera Guerra Mundial
se encuentra el de las pruebas estandarizadas de desempeo. En contraste con
las de tipo ensayo, las pruebas estandarizadas de desempeo proporcionan
preguntas de eleccin mltiple basadas en una extensa muestra con el fin de
producir normas frente a las cuales puedan ser comparados los resultados de
nuevos examinados.
Las pruebas estandarizadas de desempeo fueron adoptadas rpidamente debido
a su relativa facilidad de administracin y calificacin, as como a la carencia de
subjetividad o favoritismo, lo que s puede ocurrir en las pruebas tipo ensayo u
otras pruebas escritas. En los escenarios escolares, las pruebas estandarizadas
de desempeo permitieron mantener idnticas condiciones de evaluacin y
puntuaciones estndar para un gran nmero de nios. Estas pruebas tambin
permitieron una amplia cobertura de contenidos, un costo menor y mayor eficiencia que las pruebas tipo ensayo. En 1923, el desarrollo de las pruebas estan-

darizadas de desempeo culmin con la publicacin del Stanford Achievement


Test de T.L. Kelley, G.M. Ruch y L.M. Teman.
En los aos treinta, se reconoca ampliamente la superioridad de las nuevas
pruebas estandarizadas sobre las de ensayo debido a su objetividad y
confiabilidad.
16
Su uso prolifer de forma considerable. Es interesante ver, tal como se analizar
posteriormente, cmo los profesores de hoy en da parecen desconocerlo. Actualmente, muchas personas consideran que la mejor forma de evaluar a los nios
es mediante las pruebas escritas y los portafolios que contienen muestras de los
trabajos por encima de las pruebas estandarizadas de desempeo (Boerum, 2000;
Harris, 2002; Muir y Tracy, 1999; Potter, 1999; Russo y Warren, 1999).

Enfrentando el reto.
Para cada movimiento hay un contramovimiento, y el movimiento de las pruebas
psicolgicas en Estados Unidos en los aos treinta no fue la excepcin. Muy
pronto se escucharon las crticas para desalentar el entusiasmo y colocar a los
ms optimistas defensores de las pruebas a la defensiva. Los investigadores al
observar las limitaciones y debilidades existentes en las pruebas exigieron que
ninguna quedara por abajo de los ms altos estndares. Ni siquiera el StanfordBinet, un hito en el campo de las pruebas, qued a salv de las crticas. Aunque
las pruebas siguieron utilizndose entre las dos guerras mundiales y otras nuevas
se desarrollaban, su precisin y utilidad permanecieron bajo un continuo ataque.
Hacia finales de los aos treinta, los autores comenzaron a reestablecer la respetabilidad hacia las pruebas. Nuevas y mejoradas pruebas reflejaron el conocimiento y la experiencia de las dos dcadas anteriores. Para 1937, el StanfordBinet haba sido nuevamente revisado. Entre sus muchas modificaciones estaba la
inclusin de una muestra estandarizada de ms de 3 000 individuos. Apenas dos
aos despus de la revisin de 1937, David Wechsler public la primera versin
de la escala de Wechsler (vase captulo 10), la Escala de Inteligencia Wechsler-

Bellevue (W-B) (Wechsler, 1939). La escala Wechsler-Bellevue contena varias


innovaciones interesantes para las pruebas de inteligencia. A diferencia de la
prueba de Stanford-Binet, que slo produca una calificacin (el llamado CI o
coeficiente intelectual), la prueba de Wechsler produca varias puntuaciones, lo
que permita un anlisis del patrn de comportamiento de un individuo a travs de
la combinacin de habilidades.
Entre las diversas puntuaciones que produca la prueba de Wechsler estaba el CI.
Las pruebas de ejecucin no requieren una respuesta verbal; pueden ser utilizadas para evaluar la inteligencia en personas que tienen pocas habilidades
verbales o de lenguaje. Por tal razn la prueba de Stanford-Binet ha sido
largamente criticada por su nfasis en las habilidades verbales o de lenguaje, lo
que la hace inapropiada para muchos individuos, como aquellos que no pueden
hablar o no pueden leer. Adems, poca gente crea que las habilidades verbales o
de lenguaje jugaran un papel importante en la inteligencia humana. Por lo tanto, la
inclusin de una escala no verbal en Wechsler, ayud a superar algunas de las
debilidades tcnicas y tericas de la prueba de Binet. En 1986 la prueba de Binet
fue

totalmente

revisada

se

incluyeron

subpruebas

de

rendimiento.

Recientemente en 2003, la prueba fue objeto de una revisin general, como se


ver en el captulo 9. (Otros conceptos importantes en las pruebas de inteligencia
sern definidos formalmente en el captulo 10, que abarca las diversas escalas de
inteligencia de Wechsler.)

Pruebas de personalidad: 1920-1940


Justo antes y despus de la Segunda Guerra Mundial comenzaron a florecer las
pruebas de personalidad. Mientras que las pruebas de inteligencia medan habilidad o potencial, las de personalidad medan caractersticas o rasgos presumiblemente estables que en teora subyacen a la conducta.
17

Los rasgos son disposiciones relativamente perdurables que distinguen a un


individuo de otro (tendencias a actuar, pensar o sentir de cierta forma en una situacin determinada). Por ejemplo, decimos que algunas personas son optimistas
y

otras

pesimistas.

La

gente

optimista

tiende

permanecer

as,

independientemente de que las cosas salgan bien o no. Una persona pesimista,
en contraste, tiende a buscar el lado negativo de las cosas. El optimismo y el
pesimismo pueden, por lo tanto, ser considerados como rasgos. Uno de los
objetivos bsicos de las pruebas tradicionales de personalidad es el de medir los
rasgos. Sin embargo, como usted aprender, la nocin de rasgo tiene limitaciones
importantes.
Las primeras pruebas de personalidad fueron grupales y estructuradas escritas.
Presentaban reactivos de opcin mltiple o de verdadero-falso que podan
administrarse a grupos grandes. Las pruebas estructuradas de personalidad tienen un estmulo definido y respuestas alternativas especficas que pueden ser calificadas sin errores. La primera prueba estructurada de personalidad, fue la Hoja
de Datos Personales de Woodworth (Woodworth Personal Data Sheet), la cual fue
desarrollada durante la Primera Guerra Mundial y publicada en su versin
definitiva recin finalizada la guerra (vase figura 1-6).

Como se dijo antes, la motivacin subyacente al desarrollo de la primera prueba


de personalidad fue la necesidad de seleccionar a reclutas militares. La historia
indica que pruebas tales como la de Binet y la de Woodworth fueron creadas por
la necesidad de enfrentar retos especficos. Sin embargo, al igual que las primeras
pruebas de habilidades, la primera prueba estructurada de personalidad fue
simple, en relacin a los estndares actuales. La interpretacin de la prueba de
Woodworth dependa de la ahora cuestionada suposicin de que el contenido de
un reactivo poda ser aceptado de acuerdo a su valor nominal. Si la persona
marcaba "Falso" a la afirmacin "mojo la cama", se supona que no "moja la
cama". Esta suposicin parece lgica, sin embargo, la experiencia ha demostrado
que es ms falsa de lo que podra suponerse. Adems de parecer que no es veraz
la persona que responde, el significado de "mojar la cama" puede ser interpretado
de manera diferente por el que contesta y el que administra la prueba. (Otros
problemas relacionados con pruebas como la de Woodworth se analizan en el
captulo 13.)
La prueba de Woodworth fue seguida con entusiasmo para la creacin de una
variedad de pruebas estructuradas de personalidad, las cuales suponan que la
respuesta del sujeto poda ser tomada en su valor nominal. Sin embargo,
18

los investigadores examinaron, analizaron y criticaron las primeras pruebas estructuradas de personalidad, tal como lo haban hecho con las pruebas de habilidades. De hecho, las crticas a las pruebas que nicamente se basaban en el
valor nominal se volvieron tan intensas que las pruebas estructuradas de personalidad estuvieron cerca de desaparecer. El desarrollo de nuevas pruebas
basadas en conceptos ms modernos continu, con lo cual se revitaliz el uso de
las pruebas estructuradas de personalidad. Pero despus de la oleada de inters y
optimismo inicial durante la mayor parte de los aos veinte, el desarrollo de estas
pruebas disminuy a fines de los treinta y principios de los cuarenta. Sin embargo,
concluida la Segunda Guerra Mundial, se introdujeron pruebas de personalidad
basadas en un nmero menor y diferente de suposiciones, con lo cual se rescat
nuevamente las pruebas de personalidad estructuradas.
Durante el breve pero dramtico surgimiento y posterior cada de estas primeras
pruebas, comenz a crecer el inters por las pruebas proyectivas. Mientras que
las pruebas estructuradas proporcionan un estmulo relativamente inequvoco y
respuestas alternativas especficas, las proyectivas presentan un estmulo
ambiguo y los criterios de respuesta son poco especficos. De tal manera, que la
calificacin de las pruebas proyectivas es con frecuencia subjetiva.
A diferencia de las primeras pruebas estructuradas de personalidad, el inters por
la prueba proyectiva de Rorschach (vase figura 1-7) se desarroll lentamente. La
prueba de Rorschach fue inicialmente publicada por Hermn Rorschach en Suiza
en 1921. Sin embargo, pasaron varios aos antes de que llegara a Estados
Unidos, donde David Levy la introdujo. La primera disertacin doctoral escrita
sobre el Rorschach en una universidad de Estados Unidos se termin en 1932,
cuando Sam Beck, alumno de Levy, decidi investigar cientficamente las
propiedades de dicha prueba. Aunque en sus inicios despert poco inters, su
popularidad creci rpidamente despus del trabajo de Beck, a pesar de la critica
por parte de la comunidad cientfica. Actualmente, la prueba de Rorschach se
encuentra bajo una nube oscura, (vase captulo 14).
La aceptacin de las pruebas proyectivas se vio impulsada por el desarrollo de la
Prueba de Apercepcin Temtica (Thematic Apperception Test) (TAT) creada por

Henry Murray y Christina Morgan en 1935. Mientras que la prueba de Rorschach


contena estmulos de manchas de tinta totalmente ambiguos, el TAT era ms
estructurado. Contiene dibujos semiestructurados que representan diversas
situaciones, por ejemplo se puede ver un nio sentado frente a una mesa en la
que
19
descansa un violn. A diferencia de la prueba de Rorschach, que peda al sujeto
que explicara qu podra significar la mancha, el TAT solicita que se elabore una
historia acerca de cada una de las escenas que se le presentan El TAT pretenda
detectar las necesidades del individuo y determinar sus motivaciones.
Surgimiento de nuevos enfoques en las pruebas de personalidad
La popularidad de las dos pruebas proyectivas de personalidad ms importantes,
Rorschach y TAT, creci rpidamente hacia finales de los aos treinta y principios
de los cuarenta, quizs por la desilusin hacia las pruebas estructuradas de
personalidad (Dahlstrom, 1969a). Sin embargo, como veremos en el captulo 14,
las propiedades de las pruebas proyectivas, en particular del Rorschach, no cumplen de manera rigurosa con los criterios psicomtricos (Wood, Nezworski, Lilienfeld y Garb, 2003).
En 1943, el Inventario Multifsico de Personalidad de Minnesota (MMPI) inici una
nueva era para las pruebas estructuradas de personalidad. La idea detrs del
MMPI utilizar bases empricas para determinar el significado de una respuesta
ayud a revolucionar las pruebas de personalidad. El problema con este tipo de
pruebas, como la de Woodworth, fueron las suposiciones que hacan, mismas que
no pudieron confirmarse mediante las investigaciones cientficas. En contraste los
autores del MMPI, argumentaron que el significado de una respuesta slo puede
determinarse por la investigacin emprica. El MMPI, junto con su versin
actualizada, el MMPI-2 (Butcher, 1989, 1990), es actualmente la prueba de
personalidad ms utilizada. Su nfasis en la obtencin de datos empricos ha
estimulado el desarrollo de miles de estudios.

Casi al mismo tiempo en que apareci el MMPI, comenzaron a surgir pruebas de


personalidad basadas en un procedimiento estadstico llamado anlisis factorial. El
anlisis factorial es un mtodo que permite explicar una gran cantidad de variables
a travs de un nmero mucho menor de dimensiones (caractersticas, atributos),
llamadas factores. Podemos decir que una persona es sociable, gregaria, que
busca compaa, es comunicativa y disfruta relacionarse con los dems. Sin
embargo, estas caractersticas son un tanto redundantes. Un anlisis factorial
puede identificar la superposicin de stas y su posible agrupamiento en una sola
dimensin (o factor) como es el caso de la extroversin para las caractersticas
antes mencionadas.
A principios de los aos cuarenta, J.R. Guilford hizo el primer intento serio por usar
el anlisis factorial en el desarrollo de las pruebas estructuradas de personalidad.
Para finales de la dcada, R.B. Cattell haba introducido el Cuestionario de 16
Factores de Personalidad (16PF); a pesar de que su popularidad ha decado, se
mantiene como una de las pruebas estructuradas de personalidad mejor
elaboradas y como ejemplo tambin de una prueba desarrollada con ayuda del
anlisis factorial. Hoy en da, el anlisis factorial es una herramienta utilizada en el
diseo o validacin de las principales pruebas. (Las pruebas de personalidad
mediante el anlisis factorial sern revisadas en el captulo 13.) Vase la tabla 1-2
donde se presenta una breve revisin de las pruebas de personalidad.

Cambios en la jerarqua de pruebas


Los aos cuarenta no slo vieron el surgimiento de una tecnologa totalmente
nueva con las pruebas psicolgicas, sino tambin el crecimiento de la psicologa
20

aplicada. El papel e importancia de las pruebas utilizadas en la Primera Guerra


Mundial se reafirm en la Segunda Guerra Mundial.
En esa poca, el gobierno de Estados Unidos haba empezado a alentar el
continuo desarrollo de la psicologa aplicada. Como resultado, se proporcion un
fondo federal considerable para la capacitacin y supervisin de psiclogos con
orientacin clnica. Para 1949 se haba desarrollado y aceptado que la formacin
fuera formal a nivel de universidad y as naci la psicologa clnica. Otras ramas de
la psicologa aplicada como la industrial, la consultora, educativa y escolar
pronto comenzaron a prosperar.
Una de las principales funciones del psiclogo aplicado era administrar pruebas
psicolgicas. El informe de Shakow, Hilgard, Kelly, Sanford y Shaffer (1947), fue la
base de la formacin en psicologa clnica, especificaba que las pruebas
psicolgicas eran una funcin exclusiva del psiclogo clnico y recomend que los
mtodos de prueba fueran enseados nicamente a los estudiantes de psicologa
a nivel de doctorado. Un informe de la American Psychological Association
publicado siete aos despus (APA, 1954) confirm que el dominio del psiclogo
clnico inclua las pruebas. Sin embargo, se declar formalmente que el psiclogo
podra intervenir en psicoterapias nicamente en colaboracin "real" con los
mdicos. Por lo tanto, los psiclogos podran de manera autnoma aplicar
pruebas, pero no dar psicoterapia. De hecho, mientras los psiclogos asumieron el
rol de evaluadores, jugaron un papel complementario y con frecuencia secundario
respecto a los mdicos. Aunque la medicina pudo haber dificultado el surgimiento

de la psicologa clnica, en realidad no fue as, porque al ayudar al mdico el


psiclogo era quien evaluaba. Por lo tanto, a finales de los aos cuarenta y
principios de los cincuenta, la aplicacin de pruebas fue la funcin principal del
psiclogo clnico (Shaffer, 1953).
Para bien o para mal, dependiendo de la perspectiva personal, los esfuerzos del
gobierno para estimular el desarrollo de la psicologa aplicada, en especial de la
psicologa clnica, fueron muy exitosos. Cientos de jvenes sumamente talentosos
y creativos fueron atrados hacia la psicologa clnica y otras reas aplicadas. Los
psiclogos que usaban pruebas y otras tcnicas psicolgicas orientadas a la
solucin de problemas prcticas, fueron formados especficamente en los principios y fundamentos empricos y en las aplicaciones de la psicologa cientfica.
Provistos de un slido conocimiento acerca de la psicologa cientfica, muchos de
los primeros psiclogos clnicos deben haberse sentido frustrados por su
21
relacin con los mdicos (vase Sacuzzo-y Kaplan, 1984). Imposibilitados para
ejercer de manera independiente la psicoterapia, algunos psiclogos se sintieron
tcnicos al servicio los mdicos. El talentoso grupo de psiclogos de la posguerra
rpidamente comenz a rechazar este papel secundario. Asimismo, los psiclogos
rechazaron el uso de las pruebas por considerarla una actividad subordinada
(Lewandowski y Saccuzzo, 1976). Por otra parte, la penetracin de las pruebas y
los temores por el uso incorrecto de ellas comenzaron a despertar desconfianza y
rechazo pblico por las mismas. Los ataques hacia las pruebas llegaron de dentro
y fuera de la profesin. Estos ataques se intensificaron y multiplicaron tan rpido
que muchos psiclogos descartaron cualquier relacin con las pruebas
tradicionales desarrolladas durante la primera mitad del siglo XX. Por esta razn,
las pruebas sufrieron otro descenso dramtico en jerarqua a finales de los aos
cincuenta el cual persisti hasta entrados los setenta (vase Holt, 1967).

Ambiente actual
Durante los aos ochenta, noventa y 2000 surgieron y prosperaron varias de las
principales ramas de la psicologa aplicada: neuropsicologa, psicologa de la salud, psicologa forense y psicologa infantil. Las cuales hacen amplio uso de las
pruebas psicolgicas. De esta manera se increment su uso y mejor su estatus.
Los neuropsiclogos usan pruebas en hospitales y otros entornos clnicos para
evaluar dao cerebral. Los psiclogos de la salud usan pruebas y encuestas en
diversos escenarios mdicos. Los psiclogos forenses las utilizan en el sistema
judicial, al evaluar en una defensa el estado mental de una persona, al estimar el
impacto emocional de un individuo al enfrentar un juicio o ejecucin de una pena.
La psicologa infantil utiliza las pruebas para evaluar desrdenes de la niez.
Como en el pasado, la evaluacin psicolgica en la primera dcada del siglo XXI
contina siendo uno de los tpicos ms importantes, aunque controvertidos, en
psicologa.
Como estudiante, independientemente de las metas ocupacionales o profesionales, encontrar el material de este texto invaluable. Si se encuentra entre
aquellos interesados en el uso de tcnicas psicolgicas en un mbito activo, esta
informacin ser particularmente importante. Desde los orgenes de la psicologa
hasta nuestros das, las pruebas psicolgicas se han mantenido entre los instrumentos ms importantes del psiclogo en general y de aquellos que aplican la
psicologa en particular.
La evaluacin es uno de los elementos esenciales de la psicologa. Aunque no
todos los psiclogos utilizan pruebas y algunos se oponen a ellas, todas las reas
de la psicologa dependen del conocimiento obtenido en los estudios de investigacin que se basan en estos mtodos de medicin. El significado y la confiabilidad de estas medidas son esenciales para la investigacin psicolgica. Para
estudiar cualquier rea del comportamiento humano con efectividad, deben entenderse los principios bsicos de la medicin.
En la compleja sociedad actual, la relevancia de los principios, aplicacin y
discusin de la evaluacin psicolgica se extiende ms all del campo de la psicologa. Aun cuando no tenga planes de convertirse en psiclogo, es probable que

se enfrente a pruebas psicolgicas. Abogados, mdicos, trabajadores sociales,


gerentes de negocios, educadores y muchos otros profesionales deben tratar
22
con frecuencia con informes basados en tales pruebas. Incluso como padre, es
probable que se encuentre con pruebas (aplicadas a sus hijos). Para interpretar tal
informacin de manera adecuada, necesita la informacin presentada en este
libro.
Entre ms conozca de pruebas psicolgicas, ms confianza tendr al usarlas.
Debido a los ataques dirigidos a las pruebas y a las amenazas de prohibir o limitar
en gran medida su uso, usted tiene una responsabilidad personal y social al usar
las pruebas psicolgicas. El futuro de la evaluacin psicolgica puede depender
de usted y de gente como usted. Un conocimiento profundo en esta materia le
permitir basar sus decisiones en hechos y asegurar que las pruebas sean
empleadas con los propsitos benficos y constructivos.
Probablemente las pruebas nunca han sido tan importantes como lo son en la
actualidad. Por ejemplo, considere solamente un tipo de evaluacin aptitud
acadmica. Cada ao ms de 2.5 millones de estudiantes llevan a cabo pruebas
diseadas para medir el progreso acadmico o la adaptabilidad. El proceso de
evaluacin comienza temprano en la vida de los estudiantes. Algunas escuelas
primarias requieren ciertas pruebas y miles de nios las realizan cada ao. Cuando estos estudiantes se convierten en adolescentes y desean entrar a las escuelas
preparatorias, miles de ellos realizarn un examen de seleccin. Son pocos los estudiantes que pueden evitar presentar un examen de ingreso a una carrera universitaria. Tan slo el SAT (Scholastic Aptitude Test) se aplica a dos millones de
estudiantes de educacin secundaria cada ao. Otros 10 000 estudiantes del ltimo ao de preparatoria realizan otras pruebas con el fin de asegurarse un lugar
en la universidad.
Estas cifras no incluyen a las 75 000 personas que realizan pruebas especiales
para ser admitidas a las escuelas de administracin o las 148 000 que presentan
el Examen de Admisin para la Escuela de Leyes (Law School Admission Test) o

pruebas para ingresar a las escuelas de medicina, odontologa, militares o de


licencias profesionales, entre otras. De hecho, el Educational Testing Service
administra por s solo ms de 11 millones de pruebas anualmente en 181 pases
(Gonzlez, 2001). Como fuentes de informacin de las caractersticas humanas,
los resultados de estas pruebas impactan en las decisiones crticas de la vida.
La historia de la evaluacin psicolgica en Estados Unidos ha sido breve pero
intensa. Aunque este tipo de pruebas han estado disponibles durante mucho
tiempo, la evaluacin psicolgica es en gran medida producto de la sociedad
moderna y de su tecnologa, del crecimiento de su poblacin y de sus problemas
especficos sin precedentes. Al ayudar a resolver los retos que plantea el
desarrollo moderno, las pruebas han jugado un papel importante en la historia
reciente de Estados Unidos y del mundo. Se dar cuenta, sin embargo, que a
pesar de los avances de la teora, las tcnicas de evaluacin psicolgica, an
tienen que resolver muchos aspectos tcnicos y persisten los acalorados debates
sociales, polticos y econmicos. Sin embargo lo que prevalece en las pruebas
psicolgicas, a pesar de su fuerte oposicin, es que estn lejos de la perfeccin
pero deben satisfacer algunos requerimientos sociales importantes en la toma de
decisiones. Probablemente estas pruebas seguirn prosperando hasta-que surjan
mejores y ms objetivas formas de tomar decisiones.
La historia moderna muestra que las pruebas psicolgicas han evolucionado en un
ambiente complicado en el que tanto las fuerzas hostiles como las amigables han
producido un equilibrio caracterizado por la innovacin y la continua bsqueda de
mejores mtodos.
23
Un aspecto interesante de las pruebas es que no parece que la gente permanezca
neutral respecto a ellas. Si usted no est a favor, entonces le pedimos que
mantenga una mente abierta y flexible cuando las estudie. Nuestro objetivo es
darle informacin suficiente para evaluar la historia de las pruebas de manera
inteligente.

Para conocer otros sitios de inters en la red, puede consultar las siguientes
pginas:
www.aclu.org/FreeSpeech/FreeSpeechMain.cfm.
Officials silence critic of high-stakes testing
www.apa.org/pi/psych.html
Evaluacin psicolgica de nios pertenecientes a grupos minoritarios con idiomas
y culturas diferentes

www. apa. org/science/fairtestcode .html


Cdigo para la evaluacin imparcial en la prctica educativa

www.bccla.org/positions/privacy/87psytest.html
Confidencialidad en la evaluacin psicolgica

www. romingerlegal. com/expert/


Evaluacin psicolgica realizada por expertos en casos legales
AQU EL DOCUMENTO SALTA AL:
CAPITULO 21
La tica y el futuro de las pruebas psicolgicas

OBJETIVOS DE APRENDIZAJE
Al terminar este captulo, usted podr:
Explicar por qu la pregunta respecto a si las personas poseen rasgos estables es
un tema que pertenece al campo de las pruebas
Explicar las caractersticas de la prediccin actuarial frente a la clnica
Identificar los derechos humanos y su relacin con las pruebas
Explicar el problema de usar estereotipos en la gente
Explicar el tema de las lealtades divididas
Identificar algunas responsabilidades importantes de los usuarios y elaboradores
de pruebas

Identificar cuatro tendencias actuales importantes en el campo de las pruebas


Describir las perspectivas futuras de las pruebas,
611
En un nmero especial de Psychoogicfli Assessment, los especialistas en pruebas psicolgicas recibieron una visin del futuro del campo (Haynes, 1995). Este
futuro incluye la asimilacin de nuevos conceptos, como la teora del caos, los
modelos dinmicos no lineales y los modelos matemticos, mismos que han sido
recientemente aplicados a campos tales como la economa, la ecologa, la biologa
y la fsica (Haynes, Blaine y Meyer, 1995; Heiby, 1995a, 1995b). De hecho, el
futuro de las pruebas depende de la aplicacin de nociones tericas y de
tecnologas ultramodernas (Embretson y Hershberger, 1999; Pedersen, 2002), en
especial las computadoras e Internet (Frase et al, 2003; Saccuzzo y Johnson,
2000). Para discutir el futuro de las pruebas, no slo debemos mirar hacia adelante, sino permanecer conscientes de los muchos aspectos de interaccin, y algunas
veces de conflicto, que actualmente conforman el campo. Al hacerlo, podremos
profundizar nuestro conocimiento acerca de las pruebas y aventurar algunas conjeturas informadas acerca de su futuro. Tenga en mente que las fuerzas que influyen este futuro no operan aisladamente, sino ms bien interactan con otras en
formas muy complicadas, aun cuando aqu las tratemos de manera separada.

Aspectos que moldean el campo de las pruebas


Las preocupaciones que actualmente moldean las pruebas incluyen aspectos profesionales, morales y sociales. Los aspectos ticos subyacen a estas
preocupaciones.

Aspectos profesionales
Tres aspectos profesionales principales juegan un papel especialmente importante
en la condicin actual y en el futuro de las pruebas psicolgicas: los asuntos
tericos, la eficacia de las pruebas y la prediccin actuarial contra la clnica (vase
figura 21-1).

Asuntos tericos. Una de las consideraciones ms importantes que subyace a


las pruebas es la confianza de sus resultados (confiabilidad) (Thomas y Selthon,
2003; Tryon y Bernstein, 2003). La confiabilidad plantea un lmite superior a la
validez. De acuerdo con los Standardsfor Educational and Psychologcal Testing
de la American Education Research Association, la American Psychological
Association y el National Council on Measurement n Education, una prueba que
no es totalmente confiable (inestable) no tiene ningn significado. Puede haber
excepciones a esta regla, pero la prctica actual generalmente demanda que las
pruebas posean alguna forma de estabilidad. Como conclusin, cualquier cosa
que est siendo medida debe tener estabilidad en s misma. Decir que una prueba
tiene confiabilidad implica que sus resultados son atribuibles a una fuente
sistemtica de varianza, la cual es estable en s misma. En otras palabras, se
presume que la prueba mide una entidad estable. Existen varios tipos de
confiabilidad, dependiendo de los diferentes propsitos de las pruebas. Cada
prueba debe tener el tipo de confiabilidad que es apropiada a los usos de la
prueba (AERA, APA y NCME, 1999; APA, 2002). La mayora de las pruebas
existentes miden una entidad presumiblemente estable ya sea el individuo, tal y
como funciona actualmente, o bien algunas caractersticas temporalmente
estables del individuo. Al describir el funcionamiento actual, los psiclogos
suponen que la persona funciona as de una manera estable,
612

En otras palabras, suponen que pueden describir a la persona en trminos absolutos, como si estuviera en un vaco. Pueden decir algo como: "La persona es
emocionalmente inestable" o "La persona est fuera del contacto con la realidad",
o bien proporcionar una etiqueta o clasificacin a manera de diagnstico como
"esquizofrnico" o "neurtico". De manera similar, e incluso ms sorprendente, los
psiclogos pretenden medir cualidades perdurables que se manifestarn en el
tiempo a pesar de los factores externos inmediatos o de largo plazo (situacionales,
ambientales, etc.). Nuevamente, suponen que lo que estn midiendo existe en
trminos absolutos.
Ya sea que se mida el funcionamiento regular o una caracterstica temporalmente
estable, los examinadores siempre estiman que la fuente sistemtica de la
varianza medida por la prueba resulta totalmente de la persona ms que de algn
otro factor. Cuando intentamos medir una caracterstica estable de un individuo y
se encuentra menos que la confiabilidad temporal perfecta, suponemos que las
imperfecciones provienen de insuficiencias relacionadas con la prueba, como el
error de medicin, o bien de variables menores y fluctuantes del sujeto, como la
fatiga. Se presume entonces que la caracterstica o variable que est siendo medida es estable, existe y slo el instrumento de prueba limita la capacidad propia para medirla. Por lo tanto, entre ms precisa es una prueba, ms estable tendran
que ser los resultados.
En trminos simples, los examinadores estiman que las personas poseen
caractersticas estables (como por ejemplo, la inteligencia) y tendencias de respuesta estables (como los rasgos) que se mantienen a travs de las situaciones y
existen independientemente del entorno. Sin embargo, muchas investigaciones
empricas (Cacioppo, Berntson y Anderson, 1991) muestran que incluso las mejo-

res pruebas tienen an que lograr esa estabilidad temporal. En otras palabras, los
examinadores no pueden atribuir tan fcilmente diferencias en el tiempo nicamente al error de medicin o a las variables fluctuantes del sujeto. Por consiguiente, esta primera suposicin no es totalmente correcta. Adems, el entorno social
afecta la conducta (Corrigan, Bogner, Mysiw, Clinchot y Fgate, 2001), como se
ilustr en un modelo de Cacioppo y colaboradores (1991), que muestra la relacin
entre el dominio psicolgico y el fisiolgico (vase figura 21-2).
La cuestin de los rasgos se aplica a la psicologa como un todo y a la psicologa
de la personalidad en particular. Las primeras formulaciones de la personalidad
humana tendan a ver a la personalidad como compuesta por rasgos estables y
duraderos (disposiciones conductuales). Freud y muchos de sus seguidores, por
ejemplo, crean que las experiencias tempranas, los recuerdos, los traumas y las
ansiedades con frecuencia resultaban en disposiciones conductuales que se
mantenan a lo largo de la vida. Los puntos de vista como el de Freud, sin
embargo, fueron cuestionados por aquellos Que vean a la personalidad humana
como cambiante en vez de fija y estacionaria, as como por aquellos que
consideraban que las situaciones y los factores externos influan la conducta.
613

La mayora de las pruebas revisadas en este texto se basan en el supuesto de


que las caractersticas humanas pueden ser medidas independientemente del
contexto en el que ocurren, una teora no slo discutible, sino tambin sin un
apoyo importante (Bandura, 1986; Mischel, 1968; Ziskin, 1995). Las pruebas
psicolgicas no pueden ser mejor que la ciencia de la psicologa en la que se basan. As como la ciencia esclarece aspectos tericos bsicos, las pruebas se ajustan al conocimiento disponible. Mientras tanto, quizs el supuesto terico ms
importante de las pruebas que las caractersticas humanas son estables y pueden ser medidas independientemente del entorno es discutible.
La conducta humana puede ser el resultado de tendencias conductuales estables
de largo plazo (rasgos); los entornos externos o internos que preceden, coexisten
con, y siguen la conducta; o algn otro factor como la interaccin entre los rasgos
y los ambientes. O bien, las pruebas tienen un largo camino por recorrer antes de

que sean capaces de medir los determinantes precisos de la conducta humana o


las conceptualizaciones y supuestos subyacentes a las pruebas no son lo
suficientemente exactos para hacer predicciones precisas.
Despus de revisar las cualidades psicomtricas y los lmites de las pruebas de
personalidad y de capacidad mental, hemos concluido que, aunque la gente exhiba un centro de estabilidad, continuamente cambia. Ciertamente, una explicacin
614
de la relativamente escasa confiabilidad a largo plazo de las pruebas de personalidad es que conforme el individuo se ajusta al ambiente, cambia. De hecho, la
mayor parte de las definiciones de inteligencia incluyen la capacidad para
adaptarse o cambiar de acuerdo con las circunstancias.
Una teora que es consistente con los datos disponibles postulara que todas las
personas normales tienen la capacidad para adaptarse a las circunstancias
cambiantes (Garlick, 2002; Sternberg, 2001; Zautra, 2003). Esta capacidad, a su
vez, involucra una combinacin de factores que cambian. Nos referimos a estos
factores combinados como el ndice de competencia del individuo, que creemos
est correlacionado con las puntuaciones de las principales pruebas de capacidad
que se usan en la actualidad. Un individuo con un alto ndice de competencia
puede adaptarse de manera ms fcil y quizs encontrar ms soluciones efectivas
a las presiones del entorno que los que presentan un bajo ndice. Sin embargo,
reaccionar al entorno puede cambiar no slo las tendencias conductuales, sino
tambin el ndice de competencia. Los fracasos repetidos o el xito consistente,
por ejemplo, pueden incrementar la rigidez, la cual a su vez puede reducir el ndice
de competencia. Sin embargo, un entorno extremadamente demandante, como el
que fuerza a un individuo a recurrir a las reservas latentes, puede incrementar el
ndice. En esta teora, la capacidad y la personalidad son siempre cambiantes y
pueden ser medidas nicamente dentro del contexto en el que ocurren.
El punto aqu es que todas las pruebas psicolgicas estn basadas en teoras de
funcionamiento humano. Desafortunadamente, la validez de estas teoras y los
supuestos en los que se basan estn lejos de ser probados. Por otro lado, no exis-

te un consenso con respecto a la definicin de inteligencia humana o a la esencia


de la personalidad humana, ya sea normal o anormal. Una revolucin en la teora
psicolgica, por lo tanto, podra transformar las pruebas psicolgicas. En cualquier
caso, las pruebas actuales no son mejores que las teoras y supuestos en los que
se basan.

La eficacia de las pruebas. Un segundo aspecto profesional en las pruebas, con


un fuerte trasfondo, tiene que ver con la eficacia de las pruebas existentes. La
totalidad de este libro se ha propuesto proporcionarle el conocimiento necesario
para evaluar pruebas. Con este fin, el libro est lleno de afirmaciones sobre
estandarizacin, normas, formas de calificacin, interpretacin, diseo de pruebas,
confiabilidad y validez. Hasta ahora, sin embargo, hemos evaluado pruebas
relativas a los estndares psicomtricos tradicionalmente aceptados, ms que a
criterios externos absolutos. Muchos psiclogos, as como otras personas, han
cuestionado si an las mejores pruebas existentes poseen suficientes cualidades
de solidez psicomtrica para garantizar su uso (Greene, 2000; Wood, Nezworski,
Lilienfeld y Garb, 2003; Ziskin, 1995).
Como hemos observado, el punto central de las pruebas es cmo son utilizadas.
Podra argumentarse que no hacer ninguna prueba es preferible a aplicar una que
a menudo lleva a una conclusin incorrecta. Sin duda, hay situaciones en las que;
todos los involucrados estaran mejor sin resultados de prueba que con ellos. No
pensamos que todas las pruebas deberan ser eliminadas hasta que llegaran a
desarrollarse otras mejores, pero s creemos que la gente debera observar la
eficacia de las pruebas desde todas las perspectivas posibles. Algunas pruebas,
como ciertas de capacidad, por lo general son adecuadas en lo que se refiere a la
confiabilidad. Sin embargo, casi cualquier prueba podra beneficiarse con mayor
documentacin de validez. Evidentemente, la gente debera considerar estndares
615
absolutos, no slo los relativos, al momento de evaluar las tendencias actuales y
futuras de las pruebas.

Al final, la forma en que se usen las pruebas puede ser determinada por la ley t5
por la amenaza de un litigio. Las pruebas que llevan a sesgos de seleccin son
sospechosas. Si la prueba SAT consistentemente subselecciona a afroamericanos
y latinos para la universidad, debemos preguntar qu tan precisa es la SAT,
cunto agrega a la prediccin y si la prdida de diversidad est justificada por el
incremento en la prediccin (Geiser y Studley 2001; Rosner, 2003). En ltima
instancia, puede ser la Suprema Corte de Estados Unidos o el Congreso quien
nos diga si se justifica el uso de una prueba.
Prediccin actuarial contra clnica. Un tercer aspecto tiene que ver con la precisin
de las predicciones hechas por los usuarios de las pruebas. A lo largo de este libro
hemos argumentado que las pruebas brindan un escenario estndar en el que los
profesionales pueden observar la conducta. De igual forma, pueden usar esta
situacin conjuntamente con la experiencia y las normas locales para aumentar la
precisin en sus observaciones y decisiones. Ciertamente, los usuarios de pruebas psicolgicas deben sentirse de esta forma o simplemente no gastaran su
tiempo con las pruebas. Sin embargo, los usuarios rara vez, reciben
retroalimentacin de la precisin de sus predicciones y decisiones basadas en
pruebas. Realmente las pruebas mejoran la evaluacin o se engaan los
profesionales repitiendo sus errores y ensendolos a los estudiantes?
Es posible analizar esta pregunta desde todos los ngulos (vase Campbell, 2003;
Monahan, 2003; Ogloff y Douglas, 2003). El primer trabajo de Meehl (Meehl, 1954;
Meehl y Rosen, 1955) y de Little y Shneidman (1959) llam la atencin en cuanto
a los lmites de los datos de prueba, incluso en manos de mdicos entrenados. En
anlisis posteriores, Sawyer (1966) y Sines (1970) revisaron estudios que
comparaban un enfoque actuarial, en el cual los resultados de prueba fueron
interpretados usando un conjunto de reglas desde un punto de vista clnico, en el
que profesionales entrenados interpretaron los resultados. Estas revisiones
indicaron que el conjunto de reglas fue ms preciso que los profesionales
entrenados, aun cuando ellos conocan las reglas. Esta investigacin confirm la
conclusin inicial de Meehl (1954) de que los profesionales entrenados no podan
superar las predicciones basadas en frmulas estadsticas. Ms recientemente,

Ziskin (1995) y Dawes (1999) han argumentado que las simples tablas de datos
actuariales, como el nmero de arrestos previos y la severidad del delito, predicen
la reincidencia mejor que las pruebas o los juicios clnicos. Realmente
necesitamos psiclogos entrenados y pruebas sofisticadas para tomar decisiones?
Otros estudios y anlisis indican que el profesional entrenado es un mejor
predictor que las frmulas actuariales, en especial cuando los profesionales usan
datos de una variedad de fuentes como una batera de pruebas, una entrevista o
una historia de caso (por ejemplo, Matarazzo, 1990; vase tambin Garb, 1998;
Wood et al., 2003). En este argumento, volvemos a encontrar desacuerdo profesional en los niveles ms bsicos.
El tema de la prediccin actuarial contra la clnica ha resurgido recientemente con
la proliferacin de interpretaciones de pruebas computarizadas. Como se discuti
en el captulo 15, las computadoras estn alcanzando un papel destacado en la
calificacin de pruebas, reporte de resultados y diagnstico de clientes (Frase et
al., 2003). Puede una computadora interpretar con precisin una prueba
psicolgica? Los diversos problemas inherentes en tales interpretaciones han
616

fomentado un gran debate acerca del potencial de la computadora para diagnosticar (Saccuzzo, 1994). Como Hartman (1986) seal, numerosos abusos potenciales acompaan el uso de programas de computacin para interpretar pruebas
psicolgicas, incluyendo la trivializacin de la evaluacin, el uso del software de
manera inapropiada para el cliente y la contribucin inadecuada del psiclogo al
proceso de evaluacin. Por otro lado, permanece la pregunta de si las interpretaciones de la computadora pueden ser tan buenas, ya no digamos mejores que las

del psiclogo. Independientemente de si los psiclogos se basan ya sea en un


diagnstico generado por computadora, un servicio de pruebas o en su propia
interpretacin de los resultados, los lineamientos de APA, llamados Ethical Principies of Psychologists and Code of Conduct, especifican que es el psiclogo
quien tiene la responsabilidad de lo apropiado del anlisis (APA, 2002).
Aspectos morales
Los aspectos profesionales por s solos no determinarn el futuro de las pruebas.
El campo tambin est siendo moldeado por aspectos morales derechos humanos, etiquetar a las personas e invasin de privacidad (vase figura 21-3).
Otros dos importantes aspectos ticos son las lealtades divididas y las responsabilidades de los usuarios y desarrolladores de pruebas.
Derechos humanos. Varias clases diferentes de derechos humanos son
relevantes para las pruebas psicolgicas, incluyendo el derecho a no ser
evaluado. Los individuos que no quieren someterse a pruebas no deberan, y
ticamente no pueden ser forzados a hacerlo. No obstante, algunas excepciones a
esta disposicin se observan en los lineamientos de 2002 de la APA.
Especficamente, no se necesita consentimiento explcito para llevar a cabo una
evaluacin cuando "las pruebas son ordenadas por ley o por el gobierno", cuando
"el consentimiento est implcito ya que la evaluacin se realiza como rutina en la
actividad educativa, institucional u organizacional" o cuando "el propsito de las
pruebas es evaluar capacidades de decisin" (p. 13). Evidentemente, estas
excepciones niegan el derecho a no ser evaluado en un gran nmero de
situaciones.
Otro derecho que corresponde a las personas evaluadas es el de conocer las
calificaciones de prueba y sus interpretaciones, as como las bases de cualquier
decisin que afecte sus vidas. En el pasado, defender la seguridad de las pruebas
era de suma importancia. Hoy en da, deben seguirse tomando todas las precauciones para proteger la seguridad de las pruebas, pero no a expensas del derecho
de un individuo a conocer las bases de decisiones perjudiciales o adversas. Los

editores de pruebas que se esconden tras el velo de las leyes estadounidenses de


derechos de autor y de reglas especiales que protegen la seguridad de las
pruebas tienen la responsabilidad de hacer pblica informacin suficiente que
permita a los usuarios tomar una decisin realmente informada de su eficacia. Si
la prueba tiene sesgo de seleccin, este sesgo tendra que ser abiertamente
identificado y
617
no ocultado con publicidad engaosa o errnea. Esto es especialmente cierto para
los exmenes de licencia profesional como son los de mdicos o abogados, ya
que estos exmenes son la ltima barrera antes de ingresar en una profesin y se
sospechara de sesgo si subseleccionaran a un nmero desproporcionado de
mujeres y de minoras.
Otros derechos humanos, algunos de los cuales slo ahora estn siendo aceptados de manera amplia, son el derecho a conocer quin tendr acceso a la informacin de la prueba y el derecho a la confidencialidad de los resultados de la
misma. En la actualidad, el uso frecuente de Internet y de servicios basados en
computadora ha llevado a la APA a aadir un requisito para que los psiclogos
prevengan a los clientes del riesgo respecto a la privacidad y los lmites de
confidencialidad como resultado de la transmisin electrnica de informacin
(APA, 2002).
Los encargados de interpretar pruebas tienen la obligacin tica de proteger los
derechos humanos. Los examinados potenciales son responsables de conocer y
demandar sus derechos. La cada vez mayor conciencia entre los usuarios de
pruebas y el pblico acerca de los derechos humanos es una importante influencia
en el campo de las pruebas.
Etiquetar o clasificar a las personas. En la prctica mdica regular, primero se
identifica (diagnostica) la enfermedad o desorden de una persona. Una vez
diagnosticada, la enfermedad puede ser clasificada para poner en prctica los

procedimientos regulares de intervencin mdica. No es vergonzoso ser


diagnosticado con una irritacin de la vescula o con una enfermedad del hgado.
Sin embargo, etiquetar a las personas con ciertas enfermedades mdicas, como el
SIDA, y con desrdenes psiquitricos, puede ser extremadamente perjudicial.
Como un ejemplo de esto, el pblico tiene poco conocimiento de la clasificacin de
esquizofrnico. Por lo tanto, los que reciben esta clasificacin con frecuencia son
estigmatizados, quiz de por vida (Shibre et al, 2003). Las etiquetas tambin
pueden afectar el acceso a la ayuda. La esquizofrenia crnica, por ejemplo, no
tiene cura. Sealar a alguien como esquizofrnico crnico puede llegar a ser una
profeca que se cumple (McReynolds, Ward y Singer, 2002). Debido a que el
desorden es incurable, nada puede hacerse. Ya que nada puede hacerse porqu
alguien se va a molestar en ayudar? Ya que no se brinda ninguna ayuda, la
persona es un caso crnico.
En teora, existe otro problema con las etiquetas que la gente, desafortunadamente, en ocasiones justifica con pruebas psicolgicas. Como Szasz (1961) originalmente seal, una etiqueta mdica como la esquizofrenia implica que la
persona est enferma. Ya que no puede culparse a nadie por enfermarse, una
etiqueta mdica o psiquitrica implica que la persona no es responsable de la
condicin. Sin embargo, bien puede ser que los que han sido sealados como
psiquitricamente trastornados deban tomar la responsabilidad de sus vidas si
quieren mejorar.
Cuando tomamos la responsabilidad de nuestras vidas, creemos que podemos
ejercer algn grado de control acerca de nuestro destino (despus de todo qu
es la inteligencia?) y no simplemente ser las vctimas de fuerzas externas incontrolables. Los individuos que tienen un sentido de control o responsabilidad por
s mismos deberan ser capaces de tolerar ms estrs, frustracin y dolor que
aquellos que se sienten vctimas pasivas. Evidentemente, una persona que se
siente responsable o con control tiene ms incentivos para alterar las condiciones
negativas que uno que no lo siente.

Las etiquetas que implican que una persona no es responsable, pueden aumentar
el riesgo de que la persona as sealada se sienta pasiva. Por lo tanto, el
618
proceso de etiquetar a alguien puede no slo estigmatizar a la persona, sino reducir la tolerancia al estrs y hacer ms difcil el tratamiento. En vista de los efectos potencialmente negativos de las etiquetas, una persona debera tener el
derecho a no ser etiquetado. Cuando una evaluacin es necesaria, una prueba como la Rorschach, que se ha demostrado que exagera en la patologa de los examinados (Hamel, Shaffer y Erdberg, 2000; Shaffer, Erdberg y Haroaian, 1999), no
debera servir como base para determinar una patologa.
Invasin de la privacidad. Cuando la gente responde pruebas psicolgicas, tiene
poca idea de lo que est siendo revelado, pero con frecuencia siente que su
privacidad ha sido invadida de una forma no justificada por los beneficios de la
prueba. La preocupacin pblica referente a este tema lleg a ser tan fuerte que
las pruebas fueron investigadas por el Senate Subcomittee on Constitutional
Rights y el House Sub-comittee respecto a la invasin de la privacidad. Ninguno
encontr evidencia de un mal uso deliberado y extendido de las pruebas (vase
Brayfield, 1965).
Existen dos caras del asunto. Dahlstrom (1969b) opin que el tema de la invasin
de la privacidad est basado en serios malentendidos. l afirma que debido a que
las pruebas han sido sobrevendidas, el pblico no se da cuenta de sus
limitaciones. Las pruebas psicolgicas estn tan limitadas que no pueden invadir
la privacidad de alguien. Otro aspecto, de acuerdo con Dahlstrom (1969b), es la
ambigedad de la nocin de invasin de la privacidad. No es necesariamente incorrecto, malo o perjudicial averiguar algo de una persona. La privacidad de la
persona es invadida cuando tal informacin se usa inapropiadamente. Los psiclogos estn tica y a menudo legalmente obligados a mantener la confidencialidad, y no deben revelar ninguna informacin adicional de una persona de la que
es necesaria para lograr el propsito para el cual se realiz la prueba. Asimismo,

los psiclogos deben informar a los sujetos de los lmites de confidencialidad.


Como Dahlstrom (1969b) seal, los sujetos deben cooperar con el fin de ser
evaluados. Si a los sujetos no les gusta lo que escuchan, simplemente pueden negarse a ser evaluados.
El cdigo de tica de la APA (1992, 2002) incluye la confidencialidad. Garantizando por ley en la mayora de los estados que tienen leyes que regulan la
prctica de la psicologa, este principio significa que, como regla general, la
informacin personal obtenida por el psiclogo a travs de cualquier fuente se
comunica nicamente con el consentimiento de la persona. Algunas excepciones
incluyen circunstancias en las que retener informacin es peligroso para la
persona o para la sociedad, as como casos en los que un citatorio judicial obliga a
entregar los registros. Por lo tanto, las personas tienen el derecho a conocer los
lmites de confidencialidad y a saber que los datos de la prueba pueden ser
requeridos judicialmente y usados como evidencia en la corte (Benjamn y Gollan,
2003) o en fallos relativos al empleo (Ones et al., 1995).
Lealtades divididas. Jackson y Messick (1967, cap. 69) argumentaron hace
mucho tiempo que nadie haba formulado un conjunto coherente de principios
ticos que rigieran todos los usos legtimos de las pruebas. Actualmente, esto
sigue siendo un hecho. El centro del problema radica en las lealtades divididas
los compromisos a menudo conflictivos del psiclogo que usa pruebas. A pesar de
los casi 40 aos que han pasado desde que Jackson y Messick expresaron el
problema, el tema de las lealtades divididas permanece como un dilema central
para todos los psiclogos que usan pruebas en clnicas, escuelas, empresas,
industrias, gobierno,
619

sector militar, etc. La pregunta es, quin es" el cliente el individuo o la institucin que ordena la prueba?
Surge un conflicto cuando el bienestar del individuo est en desacuerdo con el de
la institucin que emplea al psiclogo. Por ejemplo, un psiclogo que trabaja en
una compaa industrial encargado de identificar individuos que podran venirse
abajo en situaciones de estrs tiene una responsabilidad con la institucin de
identificar a dichos individuos, as como la responsabilidad de proteger los derechos y el bienestar de los clientes que buscan empleo en esa compaa. Por lo
tanto, la lealtad del psiclogo est dividida. De manera similar, el psiclogo debe
no slo mantener la seguridad de la prueba, sino tambin no violar el derecho del
cliente a conocer la base de una decisin adversa. Sin embargo, si la base de una
decisin adversa se le explica a un cliente, esta informacin puede filtrarse y otros
con el mismo problema podran burlar la prueba. De nuevo, el usuario de la prueba queda atrapado entre dos fuerzas y principios opuestos.
En la actualidad, este conflicto ha sido resuelto como sigue. ticamente, los
psiclogos deben informar a todos los interesados en dnde se ubica su lealtad.
Deben decir a los clientes o sujetos por adelantado

CTOON van

a ser utilizadas las

pruebas y describir los lmites de confidencialidad, xcuanto a la institucin, se le


proporciona nicamente el mnimo de informacin.necesaria, tal como: "Este
sujeto tiene pocas probabilidades de fracasar en una situacin de estrs y la probabilidad de que esta conclusin sea precisa es de 68/100". La informacin personal innecesaria o irrelevante permanece confidencial.
Por otro lado, el derecho de la persona a conocer la base de una decisin adversa
puede anular aspectos de la seguridad de la prueba. Ya sea que los resultados le
sean explicados al cliente o bien se le entreguen a un representante que est
calificado para explicarlos (AERA, APA y NCME, 1999; APA, 2002).
Responsabilidades de los usuarios y de los desabolladores de pruebas. Un
segundo aspecto tico de las pruebas se refiere a las responsabilidades de los
usuarios de pruebas. Debido a que aun la mejor prueba puede ser mal utilizada, la
profesin dedicada a las pruebas se ha vuelto cada vez ms estricta y precisa al

sealar la tica para el uso responsable de las pruebas. De acuerdo con la APA
(2002), casi cualquier prueba puede ser til en las circunstancias correctas, pero
incluso la mejor prueba, cuando se usa inapropiadamente, puede lastimar al
sujeto. De particular inters es el uso de pruebas con diferentes poblaciones. Una
prueba que es vlida y confiable para un grupo puede no serlo para otro. En vista
de esto, la versin 2002 del Cdigo de tica de la APA ha aadido dos
subsecciones que instruyen a los psiclogos que administran pruebas a que
"utilicen instrumentos de evaluacin cuya validez y confiabilidad hayan sido
establecidas para su uso con miembros de la poblacin que est siendo evaluada"
y "usen mtodos de evaluacin que sean apropiados a la preferencia y
competencia del idioma del individuo". Asimismo, al interpretar resultados de
prueba, los psiclogos tienen instrucciones de tomar en cuenta las "caractersticas
de la persona que est siendo evaluada, como las diferencias situacionales,
personales, lingsticas y culturales que podran afectar los juicios de los
psiclogos o reducir la precisin de sus interpretaciones" (p. 13). Para ayudar a los
psiclogos en el proceso de elegir el tipo correcto de prueba para individuos que
son miembros de diferentes poblaciones, existen varias guas disponibles (Dana,
2000; Merrell, 2003; Naar-King, Ellis y Frey 2003). Para reducir el dao potencial,
la APA (1974, 2002) hace responsables a los usuarios de pruebas de conocer la
razn por la que se usa la prueba, las consecuencias de usarla y los
620
procedimientos necesarios para maximizar su efectividad y minimizar la injusticia.
Los usuarios de pruebas, por lo tanto, deben tener suficientes conocimientos para
entender los principios que subyacen a la elaboracin y la investigacin de apoyo
de cualquier prueba que administran. Deben conocer tambin las cualidades
psicomtricas de la prueba que se est utilizando, as como la literatura relevante
a la misma. De igual forma, deben asegurar que las interpretaciones basadas en
la prueba sean justificadas y que la prueba se est usando apropiadamente. Un
usuario de pruebas no puede argumentar ignorancia: "No pens que los datos
normativos no fueran representativos". El usuario de pruebas es responsable de

investigar toda la informacin pertinente antes de usar cualquier prueba (APA,


1992, 2002).
El desarrollador de pruebas es responsable de proporcionar la informacin
necesaria (Franklin, 2003). Los estndares actuales para el uso de pruebas establecen que sus creadores deben proporcionar un manual con informacin suficiente para permitir el uso apropiado de la misma, incluyendo datos de validez y
confiabilidad adecuados, especificar claramente los estndares de calificacin y
administracin, y entregar una descripcin clara de la muestra normativa (AERA,
APA y NCME, 1999; APA, 2002). No es inusual para un investigador recibir peticiones de los diseadores de pruebas de investigar una prueba recin desarrollada. Estos diseadores esperan que otros realicen la investigacin necesaria
para proporcionar documentacin psicomtrica adecuada. Los estndares tambin
establecen que el manual de prueba tendra que alertar contra posibles malas interpretaciones e identificar los requisitos necesarios para el uso responsable de
las pruebas. A pesar de estos lineamientos, se siguen publicando pruebas que no
cumplen con los estndares especificados (Wood et al., 2003).
Un usuario de pruebas no tiene excusa para emplear un instrumento inadecuadamente documentado que tiene consecuencias perjudiciales (Embretson y
Hershberger, 1999). El usuario de pruebas debe saber lo suficiente para distinguir
la diferencia entre una prueba que cumple con los estndares actuales y una que
no lo hace. Jackson y Messick (1967; Cap. 69) inteligentemente sugirieron que el
usuario de pruebas haga dos preguntas siempre que se proponga una prueba
para un uso particular . Primera, "Sirve la prueba como una evaluacin de las
caractersticas que pretende medir?" La respuesta est en las cualidades
psicomtricas de la prueba, como la documentacin de validez y confiabilidad.
Segunda, "Debera ser usada la prueba para este propsito? La respuesta a esta
pregunta recae en los valores ticos y sociales del usuario de pruebas, quien debe
pensar en los efectos de la prueba acerca de la persona y sus derechos humanos.
Por lo tanto, aunque los desarrolladores de pruebas tienen cierta responsabilidad

de una prueba mal diseada o de un manual inadecuado, la responsabilidad


mayor del uso tico de las pruebas recae en el usuario de las mismas.

Aspectos sociales
Adems de los aspectos profesionales y morales, los aspectos sociales juegan un
papel importante en el campo de las pruebas. Sern discutidos tres de ellos:
deshumanizacin, utilidad de las pruebas y acceso a las fuentes de pruebas
psicolgicas (vase figura 21-4).
Deshumanizacin. Un aspecto social en el campo de las pruebas se refiere a las
tendencias de deshumanizacin que acechan al proceso de las pruebas. Por
ejemplo, algunas corporaciones proporcionan anlisis computarizados del MMPI-2
y
621

de algunos otros resultados de pruebas. Esta tecnologa tiende a minimizar la


libertad individual y la singularidad. Con computadoras de alta velocidad y bases
de datos centralizados, el riesgo de que las mquinas algn da tomen decisiones
importantes acerca de nuestra vida va siempre en aumento. Por esta razn, la
sociedad debe valorar los riesgos contra los beneficios de la creciente aplicacin
de la tecnologa moderna en el campo de las pruebas. La gente debe hacer esta
evaluacin antes de que una situacin indeseable, pero inalterable, se desarrolle.
Mientras los psiclogos y el pblico permitan que los resultados de pruebas sean

almacenados y analizados por computadoras, puede llegar a ser demasiado difcil


revertir esta tendencia. La sociedad estadounidense est fundada en principios de
derechos individuales y de libertad. Cualquier cosa que amenace estos principios
como las interpretaciones de prueba computarizadas debe ser evaluada. Slo
cuando los beneficios sobrepasen los riesgos, y stos sean minimizados, la
decisin podr ser socialmente aceptable.
Utilidad de las pruebas. Las pruebas no necesitan ser perfectas en todos los
aspectos. Con frecuencia, la sociedad encuentra usos para herramientas que en
su inicio son imperfectas pero que se vuelven precisas a travs de investigacin y
desarrollo. Uno puede discriminar entre lo til y lo verdadero o correcto. Por
ejemplo, cuando la sociedad occidental crea que el Sol giraba alrededor de la
Tierra, las frmulas y principios disponibles eran tiles en tanto llevaran a ciertas
predicciones precisas, aun cuando las teoras subyacentes fueran incorrectas. De
manera similar, las suposiciones en las que se basan las pruebas actuales pueden
estar fundamentalmente incorrectas y los instrumentos de prueba resultantes lejos
de ser perfectos. Sin embargo, las pruebas pueden seguir siendo tiles mientras
proporcionen informacin que lleve a mejores predicciones y a una mejor
comprensin de lo que podra obtenerse de otra forma. Una prueba puede ser til
a la sociedad aun cuando todos los principios en los que se basa sean totalmente
incorrectos.
As, el aspecto social crucial en las pruebas no es si son perfectas, sino si son
tiles a la sociedad. Obviamente, la respuesta a esta pregunta hasta la fecha ha
sido un marcado, aunque disputado y controvertido, "S" (vase Cmara y
Schneider, 1994; Meyer et al, 2003; Ones, Chockalingam y Schmidt, 1995). Sin
embargo, conforme se obtiene nuevo conocimiento, la sociedad debe considerar
continuamente los riesgos de las pruebas contra los beneficios. Los riesgos, por
supuesto, incluyen el posible uso equivocado de las pruebas, lo que a su vez puede afectar adversamente la vida de un individuo o puede discriminar sistemticamente contra un grupo cultural especfico (vase Fish, 2002; Henry, Bryson y
Henry, 1990). Los beneficios incluyen la posibilidad de una mayor precisin e

imparcialidad en el proceso de toma de decisiones. Obviamente, la resolucin de


este aspecto recurrente afectar profundamente el campo de las pruebas.
La sociedad ha usado las pruebas modernas a gran escala. Primero los militares,
luego las escuelas y los servicios psiquitricos y por ltimo las empresas e industrias, han encontrado usos importantes para las pruebas psicolgicas. De
hecho, parece no haber fin a la proliferacin de las pruebas, a pesar de las crticas
622
y el acalorado debate. Si la capacidad de penetracin de las pruebas indica la opinin de la sociedad respecto a su utilidad, seguramente la sociedad las ha encontrado tiles. Mientras las pruebas continen cumpliendo una funcin, lo ms
probable es que sigan siendo utilizadas.
Acceso a los servicios de pruebas psicolgicas. Quin tiene acceso a los
servicios de pruebas psicolgicas? Ser evaluado puede ser costoso. Un
profesional de una gran ciudad con frecuencia cobra $5 000 dlares o ms por
administrar una batera completa de pruebas individuales, calificarlas e
interpretarlas, adems de elaborar un informe por escrito. De hecho, el costo
promedio de una evaluacin de custodia en California del Sur es de $10 000 y
puede llegar a ms de $20000. Las cuotas por pruebas neurolgicas de gran
alcance, en particular en un pleito legal, pueden ser mucho mayores. Por otro
lado, el costo de los materiales de prueba sigue siendo excesivamente alto. El
paquete de la escala WAIS-R costaba $98 en 1983. En 2003, la prueba WAIS
costaba ms de $775 y seguramente seguir teniendo aumentos en sus precios.
Como sucede con muchos otros productos, este precio pone a las pruebas fuera
del alcance de muchos. Sin embargo, si el bienestar de una persona depende de
la informacin de una batera de pruebas psicolgicas, cmo ser tomada la
decisin acerca de quin tendr acceso a las pruebas y quin no?
Tal y como estn las cosas, las costosas bateras de pruebas para evaluacin
neu-rolgica y psiquitrica slo estn disponibles para aquellos que pueden

pagarlas y para los que cuentan con un buen seguro. Por ejemplo, alguien con
una discapacidad de desarrollo en California puede ser elegible para recibir el
Medi-Cal, el cual proporciona servicio mdico gratuito, incluyendo los servicios de
un psiclogo. El individuo puede tambin ser elegible para la asistencia federal,
como el Medicare y el SSI, que otorgan beneficios en efectivo. En California,
adems, la gente con discapacidad de desarrollo (como por ejemplo, personas
con retraso mental) o aquellos con posible discapacidad de desarrollo, tienen
acceso a servicios de pruebas psicolgicas en centros regionales en todo el
estado. A menos que las leyes de California cambien, alguien que pueda tener
una discapacidad originada durante los aos de desarrollo puede solicitar (o que
alguien solicite en su nombre) una evaluacin que puede incluir un examen
mdico y una evaluacin psicolgica. El servicio es gratuito y si un equipo de
especialistas encuentra que la persona tiene una discapacidad de desarrollo,
existen servicios adicionales disponibles. Por lo tanto, las leyes y polticas
actuales, tanto de California como federales, ayudan a asegurar que determinadas
personas discapacitadas tengan acceso a los servicios de pruebas psicolgicas.
Sin embargo, dichas garantas no estn disponibles en todos los estados y
solamente ciertas personas estn protegidas.
Las leyes nacionales estn hechas para proteger los derechos de los nios discapacitados y su acceso a las pruebas. La Individuis with Disabilities Education
Act o IDEA (20 U.S.C. 1400, e. seq.) obliga a los distritos escolares de todo el
pas a buscar e identificar a nios cuyas discapacidades puedan interferir con su
educacin. La IDEA garantiza el acceso a todos los nios en edad escolar a una
educacin pblica adecuada y gratuita. Son necesarias las pruebas para determinar las necesidades de los nios. Si los padres estn inconformes con la evaluacin de una escuela, tienen el derecho, conforme la IDEA, a solicitar una
evaluacin independiente a expensas de la escuela. Por lo regular, este derecho
es suficiente para forzar a la escuela a proporcionar una evaluacin adecuada. Sin
embargo, esta proteccin est limitada a los nios de edad escolar con discapacidades o con presunta discapacidad.

623
Se ha ofrecido un seguro de salud nacional como una forma de proporcionar
servicios mdicos para todos. Hasta el momento de publicar este libro no se haba
puesto en marcha ningn programa de seguro de salud nacional. Una de las
controversias en las propuestas para dichos programas se relaciona con el alcance de la cobertura relativo a la salud mental y a si los servicios psicolgicos
deberan estar incluidos. De estarlo, cualquiera que necesite dichos servicios tendr acceso a ellos. De no ser as, la disponibilidad de los servicios de pruebas se
ver sumamente limitada. En cierto sentido, la sociedad juzgar el valor de las
pruebas al decidir si se incluyen o no en los programas de seguros de salud. Ya
que los recursos son limitados, los servicios de pruebas pueden excluir algn otro
servicio necesario o viceversa.
Tendencias actuales
Los aspectos profesionales, morales, sociales e incluso legales han interactuado
para producir las tendencias actuales en las pruebas. Estas tendencias pueden
ser ubicadas en cuatro categoras principales: la proliferacin de nuevas pruebas;
estndares ms altos, tecnologa mejorada e incremento en la objetividad; mayor
conciencia pblica e influencia, y aplicaciones de computadoras e Internet.
La proliferacin de nuevas pruebas
Nuevas pruebas siguen apareciendo todo el tiempo, y al parecer no tienen fin. Si
contamos las pruebas revisadas y actualizadas, encontramos cientos de nuevas
pruebas publicadas cada ao. El mpetu por desarrollar estas nuevas pruebas proviene del desacuerdo profesional respecto a cules son las mejores estrategias
para medir las caractersticas humanas, de la naturaleza de estas caractersticas y
de las teoras referentes a las causas de la conducta humana. (Para un ejemplo,
vase la discusin acerca del K-ABC en el captulo 11.) El mpetu surge tambin
de la presin pblica y profesional para usar solamente instrumentos justos,
precisos y sin sesgos. Al final, si las pruebas se usan, los autores y editores de

pruebas tendrn beneficios financieros. Mientras alguien pueda sacar provecho de


la publicacin de pruebas, se desarrollarn y se comercializarn otras nuevas.
Un examen de los principales libros de referencia en torno a las pruebas indica
que la mayor parte de las pruebas nuevas estn basadas en los mismos principios
y teoras fundamentales que la mayora de las ya establecidas. De hecho, la
mayora de las pruebas de desarrollo reciente son justificadas con el argumento
de que son o bien psicomtricamente superiores a las pruebas existentes o ms
especficas, y por lo tanto, ms apropiadas para problemas particulares. Sin
embargo, como se observ en el captulo 15, algunas de las pruebas ms
recientes estn basadas en modelos, teoras y conceptos que difieren
fundamentalmente de aquellas en las que se basan las pruebas tradicionales.
Estas pruebas no tradicionales derivan de conceptos y teoras modernas de la
psicologa del aprendizaje, social, fisiolgica y experimental. La mayor parte de
estas nuevas pruebas tienen sus orgenes en datos derivados empricamente
(lacono, 1991).
La proliferacin de pruebas no tradicionales est relacionada con otras dos
tendencias en las pruebas. Primera, refleja el papel cada vez mayor de la ciencia
psicolgica en la evaluacin (Haynes, 1991, 1995; Wood et al, 2003). Aun los crticos de las pruebas deben admitir que la receptividad a las crticas y un esfuerzo
honesto y persistente por mejorar la calidad de las pruebas ha caracterizado al
624
campo de la evaluacin. La aplicacin de las percepciones y los hallazgos empricos de los laboratorios psicolgicos refleja actualmente esta receptividad.
Segunda, se estn haciendo esfuerzos por integrar las pruebas con otros aspectos
de la psicologa aplicada (Aidman y Shmelyov, 2002; Wiederhold, Jang, Kim y
Wiederhold, 2002). Muchos psiclogos, especialmente los de orientacin
conductual, se han lamentado mucho de la pobre relacin entre la evaluacin clnica, las pruebas tradicionales y las intervenciones de tratamiento posteriores.

Prefieren los resultados de pruebas que no slo tienen una relacin directa con el
tratamiento, sino que pueden usarse para evaluar la efectividad del tratamiento.
Ya que los psiclogos continuamente intentan crear tales procedimientos, sus
productos se agregan a la lista de las muchas pruebas nuevas que se publican
anualmente (Chabanne, Peruch y Thinus-Blanc, 2003; Garca-Palacios, Hoffman,
Carlin, Furness y Botella, 2002; Mehl, Pennebaker, Crow, Dabbs y Price, 2001).
Estndares ms altos, tecnologa mejorada e incremento en la objetividad
Varias presiones, adems de otros aspectos, han llevado a otra corriente actual.
Los estndares mnimos aceptados para las pruebas estn siendo mayores. Antes
de que la APA (1974) definiera de forma clara y especfica sus responsabilidades,
los desarrolladores de pruebas no tenan un conjunto de lineamientos uniforme ni
ampliamente aceptado. Como resultado de ello, la calidad de las pruebas recin
publicadas ha variado mucho. Con estndares publicados, los desarrolladores de
pruebas ya no tienen que trabajar en la oscuridad. Un porcentaje cada vez mayor
de pruebas nuevas proporciona la informacin necesaria para los usuarios con el
fin de hacer una seleccin totalmente informada de las pruebas, maximizando as
la probabilidad del uso apropiado de las mismas.
Los estndares ms altos en la elaboracin de pruebas han alentado un mejor uso
de ellas (Clauser, 2002). Los estndares de 1999 han ayudado de forma considerable al volver a enfatizar la importancia crtica del uso apropiado, y al anunciar claramente las responsabilidades de los usuarios de pruebas (AERA, APA y
NCME, 1999; APA 2002). Por otro lado, un grupo de trabajo del Joint Committee
of Testing Practices, patrocinado por la American Association for Counseling and
Development, la American Educational Research Association, la American
Psychological Association, la American Speech-Language-Hearing Association y
el National Council on Measurement in Education, ha publicado un minucioso documento que delinea los requerimientos de los usuarios de pruebas (Eyde, Moreland y Robertson, 1988). Esta amplia gua especifica claramente las competencias
necesarias para usar diversos tipos de pruebas y ser un modelo para el futuro.

Asimismo, como se indic anteriormente, la tica en las pruebas ha sido


modificada para alentar el uso apropiado de las mismas y evitar el uso equivocado
(APA, 1992, 2002). Ahora que los usuarios de pruebas cuentan con la publicacin
de una serie de normas, no tienen excusa para hacer un mal uso de ellas.
Naturalmente, el mal uso, e incluso el abuso, nunca quedar totalmente eliminado,
por lo que la tendencia hacia un mejor uso de las pruebas existentes es lo ms
deseable.
En relacin con los estndares ms altos, la tecnologa mejorada ha beneficiado
enormemente el campo de las pruebas (Farrell, 1991, 1992; Haynes, 1992;
Lowman, 1991; Matarazzo, 1990; Wilson, De Boeck, Moss y Draney, 2003). Gracias principalmente a los avances en la tecnologa de las computadoras, los procedimientos estadsticos como el anlisis factorial y el anlisis de reactivos pueden
ser
625
realizados con gran facilidad. Esta tecnologa contribuye as a la comente actual
de mejores pruebas.
Tambin relacionada con estndares ms altos est la tendencia de incrementar
la objetividad en la interpretacin de pruebas. Hasta el momento de publicar este
libro, los ataques a la prueba Rorschach se han vuelto devastadores y despiadados (vase Hunsley y Bailey, 1999; Wood et al., 2003). Como resultado, los profesionales tienden a basarse en gran medida en datos objetivos como los que
proporciona el MMPI-2. Puede observarse fcilmente esta tendencia en la forma
en que ha cambiado la proporcin relativa de referencias dedicadas a la
Rorschach y al MMPI en el Mental Measurements Yearbook y en otras fuentes
(por ejemplo, Archer, Maruish, Imhof y Piotrowski, 1991).
El continuo inters de investigacin en las pruebas tambin refleja la tendencia
dirigida hacia la objetividad en el campo. En vista de las decenas de miles, si no
es que cientos de miles, de estudios publicados directa o indirectamente relaciona-

dos con las pruebas psicolgicas, un observador casual podra concluir que queda
poco por hacer. Esta conclusin est lejos de lo correcto. A pesar de los ms de
10000 artculos dedicados al MMPI y al MMPI-2, por ejemplo, se publican cientos
de artculos ms creativos y rigurosos cientficamente cada ao acerca de estas
pruebas, sin mencionar los cientos de otras pruebas incluidas en el Mental
Measurements Yearbook y otros libros de referencia. Mientras la pruebas no sean
menos que perfectas, y a este respecto tienen un largo camino por recorrer, los
investigadores en psicologa sin duda seguirn realizando investigaciones para
facilitar el uso objetivo de las pruebas.
Mayor conciencia pblica e influencia
La mayor conciencia pblica de la naturaleza y uso de las pruebas psicolgicas ha
llevado a una influencia externa cada vez mayor en las mismas. En un tiempo, el
pblico saba poco acerca de pruebas psicolgicas; los psiclogos jugaban un papel casi exclusivo al regir el uso de stas. Con la mayor determinacin del pblico
durante los aos noventa, los das en que los psiclogos imponan las reglas han
desaparecido para siempre (Saccuzzo, 1994). Creemos que esta tendencia ha
afectado al campo positivamente.
La conciencia pblica ha llevado a una mayor demanda de servicios psicolgicos,
incluyendo los de las pruebas. Esta demanda se ve compensada por la tendencia
hacia una legislacin restrictiva y a reglamentos y polticas judiciales, como el fallo
judicial que limita el uso de pruebas estndar de inteligencia para diagnosticar
retraso mental. Estas restricciones se originaron por temores pblicos reales e
imaginarios. En resumen, el pblico parece ser ambivalente en cuanto a la evaluacin psicolgica al desear los beneficios, pero al mismo tiempo con temor del poder que se le atribuye a las pruebas.
Quizs el mayor beneficio del aumento de la conciencia pblica respecto a las
pruebas ha sido la atencin especial dirigida a la defensa de los derechos
humanos. Conforme ms individuos compartan la responsabilidad de alentar el
uso apropiado de pruebas informndose de sus derechos e insistiendo en

recibirlos, la probabilidad de mal uso y abuso de las pruebas disminuir. El


compromiso del campo de la psicologa con los altos estndares ticos puede
observarse fcilmente en los lineamientos publicados, los documentos de
propuestas y los debates que han evolucionado durante el periodo relativamente
corto que inicia en 1947 con el desarrollo de normas formales para la capacitacin
en psicologa clnica (Shakow, Hil-gard, Kelly, Sanford y Shaffer, 1947). Los
profesionales de la psicologa, instructores
626
y supervisores muestran una gran preocupacin por los valores sociales y la
dignidad del ser humano. Sin embargo, la presin del inters pblico en las
pruebas psicolgicas ha llevado a los profesionales a una mayor conciencia de la
defensa de los derechos y la dignidad del individuo.
Interrelacionada con todos estos aspectos est la tendencia hacia una mayor
proteccin para el pblico. Casi todos los estados cuentan con leyes que rigen el
uso de pruebas psicolgicas. Varios factores brindan al pblico proteccin
importante contra los riesgos inherentes a las pruebas: limitacin de la evaluacin
con el fin de reducir la posibilidad de que gente no calificada use pruebas
psicolgicas, sensibilidad entre los profesionales respecto a los derechos del
individuo, fallos relevantes de los tribunales y un conjunto de lincamientos ticos
claramente expresados, as como la publicacin de normas para el uso apropiado
de las pruebas.
La computarizacin de las pruebas
A lo largo de este libro hemos discutido cmo estn siendo aplicadas las computadoras a la evaluacin de manera cada vez ms rpida y extendida. La
computarizacin de las pruebas es una tendencia importante y las computadoras,
como se vio en el captulo 15, estn siendo usadas de muchas formas diferentes.

En la evaluacin adaptada por computadora, los diferentes conjuntos de preguntas


de prueba son administrados va computadora a diferentes individuos,
dependiendo de la condicin de cada persona en el rasgo que est siendo medido
(Mills, Potenza, Fremer y Ward, 2002; Weiss, 1983, 1985). En las pruebas de
capacidades, por ejemplo, la computadora ajusta el nivel de dificultad del reactivo
de acuerdo con la respuesta del sujeto. Si la respuesta del sujeto es incorrecta, se
da entonces un reactivo ms fcil; si es correcta, aparece en seguida un reactivo
ms difcil. Un planteamiento como ste individualiza una prueba y reduce el
tiempo total de la misma. La investigacin llevada a cabo en los aos ochenta y
noventa finalmente ha llevado a la conversin de la ASVAB (Prueba Vocacional de
Aptitudes de los Servicios Armados), administrada a millones, a un formato
adaptado por computadora (vase captulo 18). Por otro lado, para el ao 2010 la
mayora de los estudiantes probablemente estar presentando pruebas como la
SAT, GRE y LSAT mediante programas adaptados por la computadora.
Las computadoras tambin estn siendo utilizadas para administrar, calificar e
incluso interpretar pruebas psicolgicas. Asimismo, estn siendo usadas para
generar tareas que no pueden presentarse por mtodos tradicionales (vase captulo 15) (Costa, De Carvalho, Drummond, Wauke y De S Guimaraes, 2002).
Mediante la tecnologa de la computacin, ser posible explorar toda una nueva
gama de capacidades que hasta ahora han estado fuera del alcance de las pruebas tradicionales (Saccuzzo, Johnson y Guertin, 1994). Pruebas de personalidad
objetivas como el MMPI pueden ser procesadas por una computadora que genera
un informe impreso. Cada ao, los desarrolladores crean ms programas que
califican pruebas y producen informes escritos (Frase et al., 2003; Prince y Guastello, 1990). El uso de la computadora se extiende a todos los tipos de pruebas,
incluyendo la evaluacin conductual (Farell, 1991, 1992).
Pruebas en Internet
De acuerdo a Crespin y Austin (2002), una de las ms importantes aplicaciones de
las pruebas psicolgicas en el futuro ser mediante el uso de Internet. Imagine la

627
posibilidad de presentar una prueba en Internet y que los resultados le sean enviados de inmediato a su doctor. Como se mencion en el captulo 15, la compaa
Brain.com ofrece pruebas de inteligencia, memoria y niveles de depresin por
Internet.

Recientemente,

la

compaa

nos

pidi

que

evaluramos

las

caractersticas psicomtricas de una de sus pruebas de Internet, una prueba de CI


de 5 minutos. Aunque la compaa no se anuncia, ms de un milln de personas
se ha registrado en este sitio y ha presentado la prueba. Nuestra evaluacin inicial
de esta prueba estuvo basada en ms de 850000 casos vlidos (Saccuzzo y
Johnson, 2000). Tales cifras no tienen precedentes en la investigacin de pruebas
psicolgicas. Encontramos un alentador coeficiente alpha de ms de 0.84. Por lo
tanto, parece ser que el futuro de las pruebas en Internet es inevitable.

Tendencias futuras
Despus de analizar los aspectos y fuerzas ms relevantes en las pruebas e identificar las tendencias actuales, estamos listos para aventurar algunas conjeturas
acerca de lo que ser el futuro en el campo. Ciertamente, estamos razonablemente seguros al afirmar que las tendencias actuales continuarn y se establecern en
el campo. Sin embargo, nuestras predicciones para el futuro son conjeturas probables basadas en conocimientos limitados.
Los prospectos a futuro de las pruebas son prometedores
Creemos que las pruebas tienen un futuro prometedor. Basamos nuestro
optimismo en el papel integral que las pruebas han jugado en el desarrollo y
reconocimiento de la psicologa. En una nota ms terrenal, las pruebas son una
industria multimllonaria e incluso las compaas relativamente pequeas pueden
ganar millones de dlares anuales. Con tanto en juego, probablemente las
pruebas llegaron para quedarse. El campo obtuvo su primer reconocimiento real a

partir de su papel en el desarrollo de pruebas de seleccin de militares en la


Primera Guerra Mundial. Posteriormente, la creatividad y habilidad de los
psiclogos en el campo de las pruebas durante la Segunda Guerra Mundial sin
duda contaron entre los factores que al final llevaron a un financiamiento
gubernamental, a travs de la Administracin de Veteranos, con el fin de alentar el
desarrollo de la psicologa profesional. De hecho, estos fondos federales,
destinados por primera vez a la psicologa en 1945, jugaron un papel importante
en el nacimiento de la psicologa clnica y en las normas de entrenamiento formal.
Como se indic, el papel central desempeado por las pruebas en el desarrollo y
reconocimiento de la psicologa no asegura por s solo un papel futuro importante
para las mismas. A pesar de la divisin que existe dentro de la psicologa en lo
referente al papel y valor de las pruebas, se mantiene como una de las pocas
funciones nicas del psiclogo profesional. Cuando uno observa que la evaluacin
psicolgica abarca no slo los usos tradicionales, sino tambin los nuevos e
innovadores como la evaluacin cognitivo-conductual, la psicofisiologa, la
investigacin de evaluaciones, la evaluacin organizacional, la comunitaria y las
investigaciones acerca de la naturaleza del funcionamiento humano se puede
entender qu tan importantes son las pruebas para los psiclogos.
As, con este lazo fundamental con las pruebas, los psiclogos se mantienen
como los lderes indiscutibles en el campo. Es poco probable que los ataques y
628
el descontento con las pruebas psicolgicas tradicionales los obliguen de repente
a abandonarlas. En su lugar, probablemente seguirn tomando la delantera en
este campo para producir pruebas cada vez mejores y tal direccin beneficiar a
los psiclogos, al campo y a la sociedad. Aun cuando esto no suceda, las compaas que publican y venden pruebas estandarizadas de alto riesgo cuyo uso es extenso, sin duda continuarn comercializando sus productos agresivamente.

Por otro lado, las pruebas son utilizadas en la mayora de las instituciones
escuelas, universidades, hospitales, industria, empresas, gobierno, etc. y las
nuevas aplicaciones y usos creativos continan surgiendo en respuesta a sus demandas. Las pruebas no desaparecern de repente sin nada que las reemplace.
Tal vez las pruebas actuales continen siendo usadas hasta ser reemplazadas por
pruebas todava mejores, lo que por supuesto puede basarse en ideas totalmente
nuevas. Aunque las pruebas actuales puedan desaparecer gradualmente de escena, creemos que las pruebas psicolgicas no solamente sobrevivirn, sino que
prosperarn en el siglo XXI.
La proliferacin de nuevas y mejores pruebas continuar
El futuro probablemente ver el desarrollo de muchas ms pruebas. Los captulos
9, 10 y 11 presentaron nuestra creencia de que las pruebas de inteligencia disponibles actualmente estn lejos de ser perfectas y que les queda mucho camino por
recorrer. Asimismo, consideramos que el papel dominante de las pruebas
Stanford-Binet y Wechsler est lejos de ser seguro. Estas dos importantes escalas
de inteligencia son probablemente tan adecuadas tcnicamente como pueden
llegar a serlo. Por supuesto, pueden, ser mejoradas mediante revisiones menores
para actualizar los estmulos de prueba y para proporcionar muestras normativas
ms grandes e incluso ms representativas con normas especiales para grupos
particulares y tambin a travs de investigacin adicional con el fin de extender y
apoyar la documentacin de validez. Sin embargo, a pesar de los cambios en la
prueba Binet moderna y en la prueba WA1S-III, las caractersticas fundamentales
y los conceptos subyacentes se asemejan a los de las escalas originales.
Durante las siguientes dcadas, nos sorprenderemos si estas dos importantes
escalas de inteligencia no son cuestionadas por lo menos una o dos veces por
pruebas similares con una estandarizacin y datos normativos superiores o con
menos sesgo contra determinadas minoras. Sin embargo, si la historia indica lo
que debe suceder, el verdadero desafo slo puede venir de una prueba que est
basada en conceptos originales y razones tericas ms extensas que las de las

escalas actuales. La Kaufman Assessment Battery for Children puede ser uno de
esos contendientes en lo que se refiere a su rango de edad. Creemos que el
desarrollo de una prueba tal es slo cuestin de tiempo. De surgir una necesidad
imperiosa para un instrumento como ese, entonces lo veremos ms temprano que
tarde.
En las pruebas estructuradas de personalidad, el MMPI-2 parece destinada a ser
la mejor prueba del siglo XXI. Esta prediccin favorable del MMPI-2 es un giro de
la prediccin hecha en 1982 en la primera edicin de este libro. No habamos
anticipado el enfoque innovador de Butcher y sus colaboradores al tratar con la
inadecuada muestra normativa del MMPI original. Por lo tanto, los prospectos para
el futuro en torno al MMPI-2 son realmente brillantes.
Como lo indicamos en el anlisis de las pruebas proyectivas, creemos que el uso
de la prueba de Rorschach disminuir significativamente en tanto los psiclogos
se enfrentan a las realidades del debate cientfico. La prueba de Rorschach
629
est basada en las primeras teoras de Freudr Sus propiedades psicomtricas estn bajo ataques continuos (Wood et al., 2003). Existe una seria duda acerca de si
la Rorschach proporciona informacin clnica til (Hunsley y Bailey, 1999). Algunos
afirman que la prueba de Rorschach no es mejor que leer las hojas del t. Aunque
nosotros no iramos tan lejos, es claro que los seguidores de la prueba estn
luchando una batalla cuesta arriba (Exner, 1999; Weiner, 2003). De nuevo, esta
prediccin es un giro de las primeras versiones de este libro. Habamos pensado
que el sistema comprehensivo de Exner proporcionara la confiabilidad de
calificacin y la administracin estandarizada necesarias para apoyar a la prueba
de Rorschach. Hasta el 2004, esta promesa no se ha cumplido.
El futuro de la prueba TAT es ms difcil de predecir. Adherida a algunas de las
principales arterias de la teora psicolgica, el TAT tiene una base de investigacin
sumamente

extensa

es

una

herramienta

clnica

importante.

Desafortunadamente, los estmulos del TAT son obsoletos. En una prueba


proyectiva, los estmulos obsoletos no son una debilidad devastadora ya que los
estmulos proyectivos son por naturaleza ambiguos. No obstante, debido a que los
estmulos del TAT han sido revisados (Ritzler, Sharkey y Chudy 1980) la prueba
puede gozar de una respetabilidad mayor conforme se obtengan ms datos de
versiones ms recientes.
Cambios revolucionarios: La "Perestroika" en la evaluacin escolar?
Hace aos, asistimos a un encuentro acerca de evaluacin en Washington, D.C.
Orador tras orador, incluyendo al Secretario de Educacin de Estados Unidos, predijeron cambios en la evaluacin que se lleva a cabo en las escuelas. Mientras
que algunos oradores enfatizaban las pruebas estandarizadas nacionales, otros
rechazaban la idea. De acuerdo con uno de los oradores, pronto habra una
"perestroika" en el campo de la evaluacin en las escuelas. Las pruebas de
desempeo reemplazaran a las pruebas estandarizadas de opcin mltiple en el
ao 2000.
El pnico es realmente alarmante en Washington D.C. por el bajo desempeo de
los nios escolares estadounidenses comparado con el de los nios de otras
naciones industrializadas, incluyendo Japn, Corea, Canad y la Comunidad Europea. En el centro del pnico se encuentra la forma como evaluamos el desempeo escolar y medimos el progreso.
Un informe de la National Commission on Testing and Public Policy (1990) seal
los siguientes puntos:
1.

"Estados Unidos debe renovar la forma en que desarrolla y utiliza el talento

humano, y para hacerlo, las pruebas educativas y de empleo deben ser


reestructuradas " (p. ix).
2.

"En cuanto a las pruebas actuales, predominantemente en formato de opcin

mltiple, se confa excesivamente en ellas, carecen de una responsabilidad

pblica adecuada, algunas veces llevan a la injusticia en la asignacin de


oportunidades y con mucha frecuencia debilitan las polticas sociales vitales" (p.
ix).
3.

"Para ayudar a promover un mayor desarrollo de los talentos de nuestra

poblacin, deben desarrollarse formas alternativas de evaluacin las cuales sean


juzgadas y utilizadas de manera ms crtica, de tal forma que las pruebas y la
evaluacin abran puertas de oportunidad en lugar de cerrarlas" (p. ix).
630

La "nueva" evaluacin exigida actualmente por la National Education Association y


otros, es una prueba de desempeo. Como ha podido observar, estas pruebas
requieren que un sujeto haga algo, ms que dar una respuesta verbal o llenar un
espacio (Harris, 2002). En las pruebas de desempeo que se aplican en las
escuelas, los estudiantes tendran que escribir ensayos, proporcionar respuestas
escritas a problemas especficos o solucionar problemas abiertos de matemticas
(vase tabla 21-1).
Las pruebas de desempeo incluyen diversos procedimientos como observar a un
estudiante extranjero mantener una conversacin en su idioma, solicitar a los
estudiantes de ciencias que lleven a cabo un experimento real, pedir a los estudiantes que trabajen juntos como grupo y observar la interaccin, y exponer

problemas que no tienen respuesta o que tienen ms de una respuesta correcta y


observar el planteamiento del estudiante. Una idea relacionada es el portafolio, un
conjunto de muestras del trabajo del estudiante.
Actualmente vemos dos posiciones contrarias, cada una de las cuales pretende
solucionar los problemas en el sistema escolar de Estados Unidos: pruebas estandarizadas nacionales contra pruebas de desempeo y portafolios. Esta batalla
no es nueva. Como se observ en el captulo 1, las pruebas de desempeo fueron
reemplazadas por las pruebas estandarizadas de logro en los aos treinta debido
a que las ltimas eran consideradas ms objetivas. En la actualidad, ms de 70
aos despus, ciertos educadores estn solicitando el regreso del mtodo
anterior. Hasta el momento de publicar este libro, no hemos visto la prometida
"perestroika" en las pruebas. De hecho, la dependencia en las pruebas
estandarizadas se ha incrementado y los riesgos se han vuelto mayores para que
los educadores independientes y los distritos escolares puedan elevar las
puntuaciones en las pruebas estandarizadas. El estudio ms extenso que se ha
llevado a cabo acerca de este tema (Pedulla et al., 2003) indic que los
profesores, con el fin de elevar las calificaciones, desviaron tiempo valioso de
clase para la enseanza de conocimientos especficos a ser evaluados, y
ajustaron su plan de estudios de tal forma que los resultados de prueba pudieran
aparecer como favorables. El nivel de ajuste se increment conforme aumentaron
los riesgos. Aunque se han alcanzado resultados favorables en pruebas
estandarizadas de esta manera, muchos profesores consideran que el xito
educativo real de sus estudiantes ha sido sacrificado. Cuarenta por ciento de los
profesores crea que las calificaciones podran elevarse sin ningn progreso real
en el aprendizaje, y el 75% pens que los beneficios de los programas de pruebas
estandarizadas no valan el tiempo y el dinero que exigan. Ms desalentador an,
631
casi un tercio de los profesores en estados donde los riesgos de las pruebas
estandarizadas eran los ms altos estuvieron de acuerdo en que las pruebas

estandarizadas estaban causando que muchos estudiantes abandonaran la


preparatoria o que fueran retrasados un ao. Independientemente de los fracasos
evidentes relacionados con el desarrollo de las pruebas estandarizadas, las
pruebas de desempeo todava no son utilizadas de manera extensa y pronto
pueden ser tan obsoletas como la antigua Unin Sovitica y los discos de vinilo.

La controversia, el desacuerdo y el cambio continuarn


No importa si el tema trata acerca de las pruebas o el del aprendizaje animal el
desacuerdo y la controversia son una segunda naturaleza de los psiclogos. El desacuerdo trae consigo nuevos datos que al final pueden producir cierta claridad,
adems de nuevas contradicciones y lneas de batalla. Probablemente los psiclogos nunca se pongan de acuerdo en que ninguna prueba es perfecta y el cambio
ser una caracterstica constante del campo. Seguimos siendo optimistas porque
vemos el cambio como algo que al final resultar en mayores datos empricos, mejores teoras, innovaciones y avances continuos, as como estndares ms altos.
La integracin de la ciencia cognoscitiva y la ciencia de las computadoras
llevar a varias innovaciones en la evaluacin
Como vimos en el captulo 15, los conceptos de las ciencias psicolgicas bsicas
se han abierto camino en el campo: la teora del aprendizaje en los aos setenta y
ochenta, y los conceptos psicofisiolgicos y psicofsicos en los aos ochenta y
noventa. Actualmente, la integracin de los conceptos de la psicologa cognoscitiva experimental, la ciencia de las computadoras y la psicometra, estn moldeando rpidamente el campo.
Las pruebas computarizadas multimedia representan la vanguardia en la nueva
generacin de instrumentos de evaluacin. La persona examinada se sienta frente
a una computadora que presenta situaciones realistas con animacin a todo color
y sonido. El programa es al mismo tiempo interactivo y adaptado por computadora.

La pantalla de la computadora se congela y le pide al examinado que d una


respuesta. Si la respuesta es buena, se presenta entonces un reactivo ms difcil.
Por ejemplo, en los programas de investigacin que estn siendo desarrollados
actualmente por compaas como IBM, la computadora puede mostrar una escena
que contenga acoso sexual. La pantalla se congela justo despus de que un
empleado ha hecho una broma inadecuada. El examinado, que est solicitando un
puesto de gerente, recibe cuatro opciones para tratar con la situacin. Si se hace
la eleccin correcta, la computadora pasa a una situacin an ms difcil, como
una amenaza del empleado ofensivo.
Las computadoras ofrecen a los desarrolladores de pruebas un alcance ilimitado
en el desarrollo de nuevas tecnologas: desde juegos interactivos de realidad
virtual que miden y registran respuestas por minuto a conflictos sociales dentro de
un mundo digital, hasta ambientes virtuales que son apropiados para medir
respuestas fisiolgicas al mismo tiempo que ofrecen seguridad y experiencias de
insensibilizacin sistemtica a individuos con fobias. Como sealamos al principio,
las computadoras guardan una de las claves principales para el futuro de las
pruebas psicolgicas.
632
RESUMEN
El futuro de las pruebas psicolgicas depende de muchos aspectos y desarrollos.
Los aspectos profesionales incluyen asuntos tericos, como la utilidad del
concepto de rasgo en oposicin al ndice de ajuste; la eficacia de las pruebas y la
prediccin actuarial contra la clnica. Los aspectos morales incluyen derechos
humanos, como el derecho a no ser evaluado, el derecho a no ser etiquetado y el
derecho a la privacidad. Otro aspecto tico que se relaciona con los usuarios y
desarrolladores de pruebas es la lealtad dividida que puede resultar de administrar
una prueba a un individuo para una institucin: Los derechos de quin son
primero? Asimismo, los profesionales tienen el deber tico de proporcionar y
entender la informacin necesaria para usar una prueba de forma apropiada.

Finalmente, los aspectos sociales como la deshumanizacin, la utilidad de las


pruebas y el acceso a los servicios de pruebas, tambin conforman el campo
actual de las pruebas.
Las tendencias actuales incluyen la proliferacin de nuevas pruebas, estndares
ms altos, tecnologa mejorada, incremento de la objetividad, mayor conciencia
pblica e influencia, la computarizacin de las pruebas y su aplicacin por Internet.
En cuanto al futuro, cualquier cosa es posible, en especial en un campo tan
controvertido como el de las pruebas. En la actualidad, la psicologa est equipada
mejor que nunca en lo que se refiere a tcnica, metodologa, datos empricos y
experiencia, y los miembros de este campo nuevo y en crecimiento, como grupo,
son relativamente jvenes. Por lo tanto, no parece que sea poco realista o demasiado optimista, esperar que en los prximos 50 aos veamos avances
similares a los producidos en los pasados 50. Por otro lado, la psicologa ha llegado tan lejos en los ltimos 50 aos que un avance comparable en los prximos
50 podra fcilmente producir resultados inimaginables hoy en da. Lo que suceda
con las pruebas en el futuro depender de las metas y objetivos elegidos por
aquellos en el campo y por su persistencia y creatividad para alcanzar sus metas.
ACTIVIDADES
Para conocer algunos sitios de inters en la Red, puede consultar las siguientes
pginas:
www.pearsonassessments.com/assessments/resources/vipreview.htm
VIP Validity Indicator Profile: Revisin de un nuevo instrumento para evaluar estilo
de respuesta

www.cspp.edu/news/forensic.htm
Psiclogos legales: pioneros modernos que tienden los puentes entre la psicologa
y la ley
www.ucm.es/info/Psyap/iaap/pslaw.htm
24 Congreso Internacional de Psicologa Aplicada (ley y psicologa)
www.dennisfox.net/psylaw/index.html
Psicologa, ley y justicia
www.law.ua.edu/lawpsychology/
The Law &> Psichology Review

Apndice 5
Cdigoi de prcticas de pruebas justas en educacin
Preparado por el Comit Conjunto sobre Prcticas de evaluacin
El Cdigo de Prcticas de Pruebas Justas en Educacin establece las principales
obligaciones para los que hacen pruebas o para los profesionales que desarrollan
o usan pruebas educativas. El Cdigo advierte aplicar ampliamente el uso de
pruebas en la educacin (admisiones, evaluacin educativa, diagnstico educativo
y ubicacin del estudiante). El Cdigo no est diseado para cubrir las pruebas
para empleo, pruebas de certificacin u otros tipos de pruebas. Aunque el Cdigo
tiene relevancia para muchos tipos de pruebas educativas, est dirigido
principalmente a pruebas profesionalmente desarrolladas como las que se venden
por editores comerciales o las utilizadas en programas de pruebas formalmente
administrados. El Cdigo no intenta cubrir las pruebas elaboradas por los
profesores en sus propios salones de clase.
El Cdigo dirige por separado los roles de los autores y usuarios de la prueba. Los
usuarios son personas que seleccionan pruebas, utilizan servicios de desarrollo de
stas o toman decisiones con base en las calificaciones de la prueba. Los autores
son las personas que las disean as como las que establecen conjuntos de
polticas para los programas particulares de pruebas. Los roles pueden, por
supuesto, traslaparse, como cuando un departamento educativo estatal encarga
servicios de desarrollo de pruebas, establece polticas que controlan el proceso de
desarrollo de las pruebas y toma decisiones con base en las calificaciones de la
prueba.
644
El Cdigo presenta estndares para los autores y para los usuarios de pruebas
educativas en cuatro reas:

A. Desarrollo/Seleccin de pruebas.
B. Interpretacin de puntuaciones.
C. Esfuerzo por la justicia.
D. Informacin para los que responden la prueba.
Las organizaciones, instituciones y profesionales individuales que aceptan el Cdigo se comprometen a seguir los principios para salvaguardar los derechos de los
que responden las pruebas. El Cdigo intenta ser consistente con las partes
relevantes de los Standards for Educationl and Psychological Tests (AERA, APA,
NCME, 1985). Sin embargo, el Cdigo difiere de los Estndares tanto en audiencia
como en propsito. El Cdigo est hecho para ser entendido por el pblico en
general, est limitado a pruebas educativas y su foco principal est en los aspectos que afectan el uso apropiado de las pruebas. El Cdigo no es para aadir
nuevos principios a los Estndares o para cambiar el significado de stos. La meta
es ms bien representar el espritu de una porcin seleccionada de los Estndares
de tal forma que sea significativa para los que responden las pruebas y/o sus
padres o tutores. Es el deseo del Joint Commitee que el Cdigo tambin sea
considerado consistente con los cdigos de conducta y estndares existentes de
otros grupos profesionales que usan pruebas educativas.

150.287
K-17p
i

El Cdigo ha sido desarrollado por el Joint Commitee on Testing Practices, un esfuerzo de


cooperacin de varias organizaciones profesionales, que tiene como meta el avance, el inters
pblico, de la calidad de las prcticas de las pruebas. El Joint Commitee se inici por la American
Educational Research Association, la American Psychological Association y el National Council on
Measurement in Educacin. Adems de estos tres grupos, la American Association for Counseling
and Development/Association for Measurement and Evaluation in Counseling and Development y
la American Speech-Language-Hearing Association son ahora los patrocinadores del Joint
Committee.Este no es material con derechos. Se fomentan la reproduccin y difusin. Por favor
ctese el documento como sigue: Code of Fair Testing Practices in Educacin. (1988) Washington,
D.C. Joint Commitee on Testing Practices. Direccin: Joint Commitee on Testing Practices,
American Psychological Association, 1200 17th Street, NW, Washington, D.C. 20036.

Potrebbero piacerti anche