Modulo Psicometria2012 PDF

1
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
PROGRAMA DE PSICOLOGA
401517 CURSO DE PSICOMETRA
MELISSA JUDITH ORTIZ BARRERO

(Director Nacional)
Bogot, D.C.
2010
NDICE
I. Protocolo
Ficha Tcnica
Introduccin
Justificacin
Intencionalidades formativas
Unidades didcticas
14
Contexto terico
15
Metodologa
16
Sistema de Evaluacin
18
Recursos Tecnolgicos
19
Glosario de Trminos
22
II. Gua Didctica
25
Presentacin
25
Fases del Aprendizaje
25
Tcnicas e Instrumentos para la Objetivacin del Aprendizaje
26
Portafolio de Desempeo Personal y Grupal
27
Descripcin de Actividades
28
III. Modulo
32
Unidad 1. Historia y conceptos bsicos de la psicometra

Captulo 1. Historia de la psicometra
Leccin 1. Antecedentes y formas rudimentarias de las pruebas psicolgicas
Leccin 2. Era de los instrumentos de bronce
Leccin 3. Estudio de las diferencias individuales e importancia de las pruebas
Leccin 4. Influencia de las primeras investigaciones sobre inteligencia

Leccin 5. Consolidacin institucional de la psicometra
Captulo 2. La psicometra y su mtodo
Leccin 6. Definicin de la psicometra
Leccin 7. Vertiente prctica de la psicometra
Leccin 8. Definiciones y objetivo de la psicometra
Leccin 9. El mtodo de la psicometra
Leccin 10. La teora de los test
Captulo 3. Desarrollo de las pruebas y metodologa estadstica de la psicometra
Leccin 11. Confiabilidad
Leccin 12. Validez
Leccin 13. Conceptos estadsticos, normas y estandarizacin parte i
Leccin 14. Conceptos estadsticos, normas y estandarizacin parte ii
Leccin 15. Construccin de pruebas
Unidad 2. Aproximacin al uso de las pruebas psicolgicas
Captulo 4. Las pruebas y su proceso de aplicacin
Leccin 16. Definicin de una prueba
Leccin 17. Tipos y usos de las pruebas
Leccin 18. Procesos de aplicacin estandarizados
Leccin 19. Procesos de aplicacin deseables
Leccin 20. Influencias del evaluador y del evaluado
Captulo 5. Pruebas de personalidad
Leccin 21. Medicin de la personalidad
Leccin 22. MMPI
Leccin 23. 16pf

Leccin 24. Test de Rorschach
Leccin 25. Casa-rbol-Persona (H-T-P)
Captulo 6. Pruebas de inteligencia y otras pruebas de las funciones cognitivas
Leccin 26. Wisc
Leccin 27. Barsit
Leccin 28. Test de aptitudes diferenciales (DAT)
Leccin 29. Test gestltico visomotor de Bender
Leccin 30. Minimental
I. PROTOCOLO
Ficha Tcnica
Nombre del curso:
Psicometra
Palabras clave:
Validez, Confiabilidad, Pruebas psicolgicas,

medicin, variables
Institucin:
Universidad Nacional Abierta y a Distancia -UNAD.
Ciudad:
Bogot Colombia
Autor del Protocolo:
Ao:
Melissa Ortiz B.
2010
Unidades Acadmicas: 2
Campo de formacin:
Disciplinar
rea del conocimiento: Ciencias Sociales y Humanidades

Crditos acadmicos:
Dos (2)
Tipo de curso:
Terico prctico.
Destinatarios:
Competencia general
de aprendizaje:
Estudiantes de pregrado del programa de

psicologa de la Universidad Nacional Abierta y a
Distancia -UNAD-.
Los estudiantes evalan las capacidades mentales
Haciendo uso de diversos mtodos, tcnicas y
pruebas de evaluacin.
Metodologa de oferta: A distancia. (Campus Virtual)

Formato de
circulacin:
Documentos impresos, Web.
Denominacin de las
1. Historia y conceptos bsicos de la Psicometra
unidades didcticas:
2. Aproximacin al uso de las pruebas psicolgicas
Introduccin
Las intencionalidades formativas de este curso van dirigidas principalmente al
desarrollo de competencias cognoscitivas y prcticas en el orden del analizar,
explicar los fundamentos conceptuales y metodolgicos sobre los que se construye la
psicometra y los principales instrumentos de medicin de eventos psicolgicos.
Sus unidades didcticas abarcan los temas de la historia de la psicometra, sus
presupuestos bsicos tericos y metodolgicos y la comprensin y uso de algunos
instrumentos que miden o evalan diferentes caractersticas psicolgicas de los
individuos, entre ellos estn la prueba Rorschach, el MMPI, el 16 PF y el WISC-R.
El rea temtica abordar el estudio de los principios de la medicin y evaluacin

en la disciplina de la psicologa y de los fenmenos psquicos que son
determinantes en el comportamiento humano, en tanto que la psicometra es un
rea de la psicologa cuya finalidad intrnseca consiste en aportar soluciones al
problema de la medida en cualquier proceso de investigacin del comportamiento. Es
adems un campo metodolgico que incluye teoras, mtodos y usos de la medicin
psicolgica en aspectos conceptuales e instrumentales.
La metodologa enseanza - aprendizaje de este curso se adelantar utilizando las
estrategias de tipo interactivo desarrolladas por la UNAD, propias de la Educacin a
Distancia. Los procesos de evaluacin requerirn del estudiante su disposicin
investigativa y participativa, se promover la discusin y la proposicin.
Los documentos que el estudiante se encargar de leer para llevar a buen trmino el
curso
sern
principalmente
escritos
que
se
encuentran
en
las
revistas
electrnicas cientficas de psicologa (medicin y psicometra). La participacin y el

trabajo activo tanto del estudiante como del tutor permitirn que el curso cumpla las
metas propuestas.
Al ser un curso diseado para estudiantes de educacin a distancia, hace nfasis

en la autogestin formativa mediada sincrnica y asincrnica, proponiendo
interacciones entre tutor y estudiante y de los estudiantes entre s. Constituye dos
crditos acadmicos equivalentes a 96 horas de estudio, distribuidas de la siguiente
manera:
Estudio independiente: 64
Acompaamiento y seguimiento tutorial: 32
El campo de formacin corresponde al rea bsica disciplinar dentro de los crditos
obligatorios del plan de estudios. El curso es conducente a la autogestin
estudiantil de los conocimientos metodolgicos y conceptuales tericos necesarios
para la comprensin y desarrollo de habilidades en medicin de variables
psicolgicas. A travs del curso se prepara al estudiante para reflexionar crticamente
en torno a la utilidad de la medicin y la evaluacin de las habilidades y destrezas
cognoscitivas adems de los riesgos y desventajas que pueden generar.
Justificacin
La psicometra es una herramienta indispensable para las actividades relacionadas

con la psicologa principalmente en el campo de la evaluacin y el diagnstico,
permitiendo niveles altos y objetivos de medicin del comportamiento humano. Una de
las dificultades que debe afrontar el psiclogo, en cualquiera de sus reas de
desempeo, es precisamente la evaluacin, puesto que el hombre con su
diversidad en todos los aspectos hace que la cuantificacin del comportamiento sea
compleja.
La formacin en psicometra provee a los estudiantes la posibilidad de acercarse a la

medicin de eventos psicolgicos; forma al estudiante en los paradigmas
particulares de resolucin de problemas psicolgicos, instalndolo en los procesos de

comprensin y uso tcnico de pruebas propias de esta ciencia. Algunas preguntas que
guiarn este curso son las que siguen:
-
Cul ha sido el curso histrico que ha permitido el desarrollo de pruebas o test

de medicin de eventos psicolgicos?
Qu significan en la medicin los conceptos de validez y confiabilidad?
Qu pruebas se utilizan con mayor frecuencia en psicologa y que fenmenos

psicolgicos miden?
Para resolver estos y otros cuestionamientos, el presente curso acadmico

abarcara dos elementos centrales de la psicometra: la historia, los elementos
metodolgicos y conceptuales para la construccin de test y la segunda parte
estar dirigida a la comprensin y manejo de algunas pruebas de uso tradicional
en diferentes reas de la psicologa.
Intencionalidades Formativas
Propsitos de formacin
1. Explicar los conceptos fundamentales sobre los que se construye la psicometra
como estrategia cuantitativa de la psicologa, valindose de las principales teoras
y modelos psicolgicos y estadsticos que la ha abordado.
2. Valorar los aportes tericos de las diferentes escuelas psicolgicas a la
comprensin de la medicin, partiendo de criterios cientficos y experimentales.
3. Demostrar la existencia e importancia de los procesos psicolgicos y su posibilidad
de cuantificarlos.
4. Hacer una aproximacin metodolgica y conceptual sobre las capacidades
cuantitativas y cualitativas de algunas pruebas que se han utilizado para medir
diferentes caractersticas psicolgicas, a travs de ejercicios y aplicaciones y
calificacin de algunos instrumentos de alta tradicin en la psicologa cientfica.
5. Contribuir a la mejora de hbitos de indagacin y pesquisa sistemtica travs

del desarrollo de competencias de investigacin formativa mediante el
conocimiento de protocolos y pruebas psicomtricas.
6. Generar en el estudiante una actitud crtica, a travs del fomento de la discusin y
el trabajo colaborativo en redes de comunidad acadmica en psicometra, a partir
de la seleccin y valoracin de las diferentes pruebas que aporta la psicologa y
otras formas de abordaje de la medicin del comportamiento.
7. Potenciar los procesos de autoaprendizaje del estudiante a travs del desarrollo de
estrategias de autogestin formativa, a partir de la interaccin con medios y
mediaciones incluidos escenarios virtuales, coherentes con la estructura
epistemolgica y metodolgica de la medicin en psicologa.
8. Desarrollar capacidades de medicin y evaluacin psicolgica, a travs del
entrenamiento en el uso de algunas pruebas y estrategias que permitan una
aproximacin del estudiante a los problemas de desarrollo y consolidacin de la
psicometra.
Los propsitos expuestos se pueden globalizar en la siguiente sntesis:
Contribuir al desarrollo del espritu investigativo del estudiante en el rea de
Psicometra, a partir del anlisis de los elementos centrales de los mtodos y
aproximaciones tericas, mediante la organizacin y seleccin de actividades que
perfilen el autoaprendizaje y la discusin con sus pares y el docente gua.
Objetivos de aprendizaje
-
Que el estudiante adquiera los conocimientos necesarios y suficientes que

permitan la comprensin de los aportes de la psicometra al desarrollo y estudio del
comportamiento
(lase
personalidad,
actitud,
aptitud,
inteligencia,
competencia, etc.), mediante el estudio de las diferentes teoras y modelos

psicolgicos y que la explican.
10
Que el estudiante describa, relacione y comparare los aportes tericos y

metodolgicos que han permitido el desarrollo de la medicin en psicologa, a
travs de ejercicios de aplicacin de pruebas psicomtricas.
Que el estudiante comprenda la importancia de la medicin, mediante el estudio y

aplicacin
situaciones
donde
se
requiera
la
cuantificacin
del
comportamiento.
Que los estudiantes adquieran las destrezas necesarias para la formulacin y

resolucin de problemas de investigacin psicomtrica.
Capacitar a los alumnos para comprender y analizar crticamente la bibliografa

relacionada con cualquiera de los campos de la Psicometra.
Que los alumnos conozcan y sepan utilizar adecuadamente los principales

esquemas procedimentales para la medicin de variables psicolgicas.
Dotar a los alumnos de herramientas para que generen sus propios criterios con la
finalidad de que puedan realizar juicios crticos en relacin con la calidad y
adecuacin de los diferentes instrumentos de medida que habrn de utilizar en el
desempeo de su labor como profesionales.
Motivar positivamente a los alumnos hacia la Metodologa de las Ciencias del

Comportamiento en general y respecto a los problemas propios de la
Psicometra en particular.
Promover actitudes favorables a la investigacin cientfica y al mtodo cientfico

como una forma de enfrentarse a los problemas psicolgicos.
11
Competencias
Teniendo en cuenta las fases del aprendizaje (reconocimiento, profundizacin y
transferencia), se desarrollarn entonces, competencias de tipo cognoscitivo, prctico
y afectivo que permitirn la apropiacin e interiorizacin del conocimiento. Las
competencias que se presentan a continuacin procuran vincular e integrar los
diferentes elementos tericos y metodolgicos de los diferentes contenidos del
presente curso y que el estudiante desarrollar a lo largo del aprendizaje meditico
sobre el que est basada su didctica:
Tener como meta de actuacin la calidad del trabajo realizado (es decir, no slo
trabajar de modo eficaz sino tambin del mejor modo posible).
Inters por la investigacin y creacin de nuevos datos en Psicologa, tanto

como receptor o evaluador de las innovaciones, como usuario o como
generador de las mismas.
Conocer y cumplir la normativa tica propia de la profesin y de la investigacin

psicolgica y respetar los derechos de consultantes y usuarios de los servicios
psicolgicos.
Tener la capacidad de valorar los procedimientos utilizados para obtener datos

psicolgicos relevantes as como para valorar la pertinencia de los informes
resultantes de la investigacin y evaluacin psicolgicas.
Transferencia y uso flexible del conocimiento.
Habilidad para transferir el conocimiento acadmico a las diferentes situaciones

reales.
12
Saber aplicar distintos mtodos de medicin, evaluacin y diagnstico en los

mbitos aplicados de la Psicologa.
Conocer y respetar la diversidad psicolgica, las creencias y valores de otros

grupos humanos.
Tener inters y respeto por las aportaciones de otros campos a la Psicologa y

de sta a ellos.
Manejo de informtica e Internet como usuario.
Saber planificar y realizar una bsqueda bibliogrfica o de referencias tanto en

bases de datos informatizadas como en bibliotecas y hemerotecas.
Conocer y utilizar adecuadamente los conceptos cientficos propios de la

Psicologa.
Saber comunicar resultados psicolgicos de forma oral adecuando la

presentacin al destinatario/s de la misma.
Saber analizar, sintetizar y resumir la informacin procedente de textos

cientficos y profesionales relacionados con la psicologa.
Identificar la conducta o el proceso psicolgico objeto de estudio, as como las

conductas o procesos vinculados y la estrategia para evaluarlos o medirlos.
Metas
Al finalizar el curso el estudiante estar en capacidad de:
13
Reconocer los mtodos y tcnicas que se han usado en psicometra usando

como estrategia el desarrollo de ejercicios aplicados.
Reconocer algunos hitos histricos del estudio de la medicin psicolgica a

partir de la lectura de los textos asignados al curso.
Esbozar mediante mapas conceptuales, los componentes medulares de las

diferentes herramientas estadsticas que cuantifican el comportamiento.
Analizar los conceptos y categoras fundamentales de las pruebas psicolgicas,

usando como estrategia la comunicacin interactiva (Chat) con sus compaeros de
curso y el tutor.
A travs del trabajo grupal, aplicar los conceptos bsicos de la medicin

psicolgica para explicar y predecir el comportamiento en diferentes campos de la
accin humana.
14
UNIDADES DIDCTICAS
Unidad
Captulo
Unidad 1. Historia Y
Conceptos Bsicos
De La Psicometra
Captulo 1. Histora De
La Psicometra
Leccin
Leccin 1. Antecedentes Y Formas

Rudimentarias De Las Pruebas Psicolgicas
Leccin 2. Estudio De Las Diferencias
Individuales E Importancia De Las Pruebas
Leccin 3. Era De Los Instrumentos De Bronce
Leccin 4. Influencia De Las Primeras
Investigaciones Sobre Inteligencia
Leccin 5. Consolidacin Institucional De La
Psicometra
Captulo 2. La
Psicometra Y Su
Mtodo
Leccin 6. Definicin De La Psicometra

Leccin 7. Vertiente Prctica De La Psicometra
Leccin 8. Definiciones Y Objetivo De La
Psicometra
Leccin 9. El Mtodo De La Psicometra
Leccin 10. La Teora De Los Test
Captulo 3. Desarrollo
De Las Pruebas Y
Metodologa
Estadstica De La
Psicometra
Leccin 11. Confiabilidad (Completar)

Leccin 12. Validez (Completar)
Leccin 13. Conceptos Estadsticos, Normas Y
Estandarizacin Parte I
Leccin 14. Conceptos Estadsticos, Normas Y
Estandarizacin Parte Ii
15
Leccin 15. Construccin De Pruebas
Unidad 2.
Aproximacin Al Uso
De Las Pruebas
Psicolgicas
Captulo 4. Las
Pruebas Y Su Proceso
De Aplicacin
Leccin 16. Definicin De Una Prueba

Leccin 17. Tipos Y Usos De Las Pruebas
(Obtencin)
Leccin 18. Procesos De Aplicacin
Estandarizados
Leccin 19. Procesos De Aplicacin Deseables
Leccin 20. Influencias Del Evaluador Y Del
Evaluado
Captulo 5. Pruebas
De Personalidad
Leccin 21. Medicin De La Personalidad

Leccin 22. Mmpi
Leccin 23. 16pf
Leccin 24. Test De Rorschach
Leccin 25. Casa-rbol-Persona (H-T-P)
Captulo 6. Pruebas
De Inteligencia Y
Otras Pruebas De
Las Funciones
Cognitivas
Leccin 26. Wisc

Leccin 27. Barsit
Leccin 28. Test De Aptitudes Diferenciales (Dat)
Leccin 29. Test Gestltico Visomotor De Bender
(P.405)
Leccin 30. Minimental
16
Descripcin de las unidades didcticas

A partir de la concepcin epistemolgica para el autoaprendizaje de la psicometra se
ha
seleccionado
las
palabras
claves:
psicometra,
medicin
personalidad,
inteligencia, validez, confiabilidad, etc., como base para el diseo de las unidades
didcticas indispensables en el presente curso.
Unidad 1
Historia y Conceptos Bsicos de la Psicometra
La unidad introduce al estudiante en el desarrollo histrico de la psicometra, sus
aproximaciones y autores ms influyentes y el proceso cientfico por el cual la
medicin adquiere importancia y reconsolida principalmente con el uso de test y de
herramientas estadsticas.
Unidad 2
Aproximacin al Uso de Pruebas Estandarizadas
Presenta las caractersticas de cuatro pruebas de gran reconocimiento en la
psicologa y con el acompaamiento del tutor se espera que los estudiantes logren
entrenarse en su uso e interpretacin de resultados.
Contexto Terico
La Psicometra es la ciencia de la medida de los aspectos "psicolgicos" de una
persona, tales como conocimiento, habilidades, capacidades, o personalidad.
La medida de estos aspectos es difcil, y gran parte de la investigacin y tcnicas
acumuladas en esta disciplina estn diseadas para definirlos de manera fiable antes
17
de cuantificarlos. Los crticos argumentan que tales definiciones y

cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas.
18
Los primeros trabajos de psicometra se desarrollaron para medir la inteligencia.

Posteriormente, la teora psicomtrica se ha aplicado a la medida de otros aspectos
como la personalidad, las actitudes, las creencias, el rendimiento acadmico y en
campos relacionados con la salud y la calidad de vida.
Los contenidos de la psicometra se articulan, fundamentalmente, en dos grandes
bloques: teora de los test, que hace referencia a la construccin, validacin y
aplicacin de los test, y escalamiento, que incluye los mtodos para la elaboracin de
escalas psicofsicas y psicolgicas.
A su vez, la teora de los test se divide en dos ramas: la teora clsica de los tests y la
ms reciente teora de respuesta a los tems.
Los conceptos clave de la teora clsica de los tests son: confiabilidad (fiabilidad) y
validez. "Confiabilidad" es medir algo de forma consistente; mientras que "validez" es
medir lo que realmente se pretende medir.
Ambas propiedades, confiabilidad y validez, admiten un tratamiento matemtico
(estadstico).
La consistencia interna puede calcularse por correlacin entre distintos tests. Los
mtodos ms conocidos se denominan: mtodo de las formas paralelas, mtodo
del test-retest y mtodo de las dos mitades.
La validez puede calcularse correlacionando las mediciones con las de una medida
patrn aceptado como vlida. Se distinguen los siguientes aspectos: validez de
contenido, validez predictiva y validez de constructo.
Metodologa
Este curso se desarrollar de manera virtual, con el acompaamiento del tutor y el
19
trabajo orientado a travs del Protocolo, la Gua de Actividades y el Protocolo. Para
20
cada Unidad Didctica se desarrollarn actividades tanto individuales como

colaborativas que den cuenta de las competencias y metas a desarrollar. Tambin se
generarn espacios de discusin y participacin a travs de foros virtuales que sern
sealados en la Gua de Actividades. Con esto no slo se pretende un aprendizaje
memorstico de los conceptos ms relevantes y caractersticos de la Psicometra, sino
que tambin se procurar la consolidacin de un sentido crtico y proponente que
facilite la aplicacin de estos conceptos y sus mtodos de abordaje a situaciones
donde el actuar y el criterio del psiclogo sea determinante, elemento bsico de las
intencionalidades formativas del curso.
Fase de reconocimiento hace referencia a la confrontacin de los contenidos del
curso con los conocimientos y experiencias previas, identificando nuevos conceptos a
adquirir.
Fase de profundizacin se refiere al conjunto de actividades orientadas a precisar
las nociones, procedimientos y estado del arte en los campos de la medicin
psicolgica.
Fase de transferencia integra los aprendizajes mediante una recontextualizacin,
resignificacin y aplicacin autnoma a situaciones problmicas de naturaleza terica
o
prctica,
generando
competencias
para el
futuro
desempeo
interdisciplinario y transdisciplinario en el campo profesional.

El proceso general se complementa y refuerza con procesos de autoevaluacin,
coevaluacin y heteroevaluacin, articulados con sistemas de interactividad
pedaggica para socializacin de logros del estudio independiente, en pequeos
grupos colaborativos y tutora individual. El proceso final se refuerza con la
retroalimentacin sobre los logros sustentados en los procesos evaluativos a nivel
formativo.
21
Sistema de Evaluacin
La evaluacin se concibe como un proceso continuo orientado a verificar las
competencias logradas en concordancia con los objetivos del curso acadmico de
Psicometra. El proceso de evaluacin se guiar por el modelo institucional y se
ejecutar con base en los siguientes momentos: autoevaluacin, coevaluacin y
heteroevaluacin
Autoevaluacin: La realiza el estudiante al inicio y al final de cada fase de
aprendizaje con el fin de identificar las debilidades o vacos cognoscitivos, como
sus logros o dominios en el abordaje de la medicin psicolgica. La autoevaluacin se
entiende como una oportunidad para hacer la revisin y reflexin autocrtica de los
procesos, aprendizajes y productos que est llevando a cabo el estudiante. Tiene
por objeto que el estudiante juzgue objetiva y constructivamente sus propios
esfuerzos, resultados y productos con base en las metas trazadas por l mismo.
Con esta se espera identificar los progresos alcanzados por el estudiante y las
necesidades, aspiraciones y metas para aprendizajes futuros.
Coevaluacin: Es un proceso de trabajo colaborativo de los estudiantes en el cual
socializan el resultado de sus construcciones personales de conocimiento y reciben la
realimentacin de sus compaeros, sustentan sus puntos de vista, asimilan
nuevos enfoques y ajustan sus planteamientos con el enriquecimiento conceptual
logrado en el dialogo de saberes. Los momentos de coevaluacin integran la
orientacin pedaggica de la gua de actividades y la autorregulacin del
aprendizaje por parte del estudiante.
Heteroevaluacin: Es una evaluacin sumativa coordinada a nivel nacional en cuanto
a fechas y contenidos, adems de la revisin y realimentacin por parte del tutor sobre
las construcciones cognitivas registradas sistemticamente en el portafolio de
desempeo personal.
22
El tutor enfoca la heteroevaluacin como un anlisis de logros a partir del

acompaamiento a los estudiantes en sus procesos de aprendizaje evidenciados
en resultados participativos en listas de correo, foros, mural electrnico, laboratorios
y dems eventos tericos o prcticos con productos de conocimiento destinados a
registro en el portafolio de desempeo personal. Ms el resultado del examen final.
La distribucin porcentual de notas asignadas en los procesos evaluativos es la
siguiente:
Valores de notas por actividades
Resultados o productos de las actividades de
aprendizaje consignados en el PDP y PDG
Evaluacin final nacional
segn fases de aprendizaje.

Fase de reconocimiento:
10% de la nota
Fase de profundizacin:
Prueba objetiva
30% de la nota
Fase de transferencia:
20% de la nota
Total: 60% de la nota definitiva
Valor: 40% de la nota definitiva
23
Recursos Tecnolgicos
Las actividades estn centradas en el estudiante como autogestor de los procesos
de aprendizaje, por lo cual se establece una sinergia de medios y mediaciones. Los
recursos que el estudiante aprovechar son los siguientes:
El computador como herramienta informtica para estudio con CD ROM, con

informaciones visuales, auditivas y de texto escrito.
El computador como canal electrnico hacia links hipertextuales en

ambientes virtuales de autoaprendizaje, tiles para gestin de conocimiento
actualizado.
Sistemas y plataformas tecnolgicas institucionales para videoconferencias y

audioconferencias.
Protocolo acadmico, gua de actividades de aprendizaje, mdulo, fuentes

hipertextuales de consulta, para estudio temtico y orientacin pedaggica.
Programacin de eventos de socializacin y trabajo colaborativo y sesiones

de asesora.
Eventos de prcticas de laboratorio de carcter obligatorio en el curso.
Interacciones programadas en aula virtual.
Una presentacin sistematizada de estos recursos interactivos se puede visualizar

en la grfica Recursos:
24
Fuentes
Documentales
Adems de los recursos didcticos como material impreso y ayudas
audiovisuales incluidas como parte de las unidades didcticas de este curso, se
seala en cada una de ellas una serie de fuentes documentales hipertextuales
que permiten profundizar con suficiencia y calidad las construcciones
conceptuales definidas en los objetivos y metas de aprendizaje.
25
GLOSARIO DE TRMINOS
Psicometra: rea de la psicologa cientfica que se encarga de la medida de los
aspectos "psicolgicos" de una persona, tales como conocimiento, habilidades,
capacidades, o personalidad.
La medida de estos aspectos es difcil, y gran parte de la investigacin y tcnicas
de cuantificarlos. Los crticos argumentan que tales definiciones y
cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas.
Inteligencia: Es la capacidad evolutiva por la cual el individuo es capaz de tomar
decisiones
dependiendo de
su entorno,
mejorar
sus condiciones
de
supervivencia, como individuo, como grupo o como especie.

Esta definicin se basa en que no vivimos para pensar, sino que pensamos para
vivir. Evolutivamente hablando, los seres ms simples reaccionan ante el medio por
programacin gentica, miedos y afinidades instintivas. Un pequeo cambio en estos
instintos supone muchas generaciones. Para que la adaptacin al medio sea ms
rpida son los propios individuos los que han de reprogramar sus
comportamientos, aprendiendo del medio y reaccionando en consecuencia, esto
es, con inteligencia.
Habilidad: Grado de competencia de un sujeto concreto frente a un objetivo
determinado. Es decir, en el momento en el que se ha alcanzado el objetivo
propuesto en la habilidad, se considera que sta se ha logrado a pesar de que este
objetivo se haya conseguido de una forma poco depurada y econmica. Se considera
a la habilidad como a una aptitud innata o desarrollada o varias de estas, y al grado
de mejora que se consiga a estas mediante la prctica, se le denomina talento.
26
Personalidad: Conjunto dinmico de caractersticas emocionales, de pensamiento y

de conducta que son nicas a cada persona. Hay diversas aproximaciones tericas a
la personalidad en psicologa, cada una proponiendo una relacin distinta entre la
personalidad y otros constructos psicolgicos, sobre cmo se desarrolla la
personalidad o cmo sta interacta con los sucesos. Se puede definir como la suma
total de las formas en que un individuo reacciona y se relaciona con los dems; son
los rasgos mensurables que exhibe una persona.
16PF: Sixteen Personality Factors" de Raymond Catell. El 16PF es una prueba
estructurada comnmente utilizada y favorecida, por diversos investigadores alrededor
del mundo, como instrumento para la medida y comprensin de la personalidad. Es el
resultado de ms de cuarenta aos de investigacin emprica por el psiclogo
Raymond B. Cattell, quien redujo 4504 rasgos de personalidad a
16 rasgos bsicos, mediante anlisis factorial. La prueba se basa en la medida
independiente de varios factores psicolgicos. Ha sido debidamente validada y
revisada, y al presente existen varias formas (A, B, C, D & E) que facilitan la
aplicabilidad de la prueba a los diferentes intereses especficos de investigacin.
MMPI: Inventario Multifasico de Personalidad de Minnesota (S.R. Hathaway y J.C.
Mckiney, USA.) Cuestionario de Personalidad encaminado a la bsqueda de
trastornos psicolgicos, formado por 566 tems a los que hay que responder V o F.
Tiene tres grupos de escalas y mide 19 variables. Tiene en cuenta la validez interna
de las respuestas del sujeto.
WISC R: Escala de Inteligencia (Revisada) de David Wechsler para Nios.
Test de Rorscharch: Test de personalidad Proyectivo (H. Rorscharch). Evala
aspectos profundos de la personalidad. Contiene diez lminas con manchas de
tinta inestructuradas susceptibles de diversas interpretaciones. Su aplicacin requiere
conocimientos psicolgicos amplios y una amplia experiencia.
27
Test Psicolgico: Una situacin experimental estandarizada que sirve de estmulo a

un comportamiento. Tal comportamiento se evala por una comparacin estadstica,
respecto a otros individuos colocados en la misma situacin, lo que permite clasificar
al
sujeto
examinado, ya sea cuantitativamente, ya sea
tipolgicamente (Pierre Pichot, "Los test mentales", Editorial Paids. Buenos Aires.
1960
Teora de
los tests:
Los
contenidos de
la
psicometra
se
articulan,
fundamentalmente, en dos grandes bloques: teora de los test, que hace referencia a
la construccin, validacin y aplicacin de los test, y escalamiento, que incluye los
mtodos para la elaboracin de escalas psicofsicas y psicolgicas. La teora de los
test se divide en dos ramas: la teora clsica de los tests y la ms reciente teora de
respuesta a los tems. Los conceptos clave de la teora clsica de los tests son:
fiabilidad y validez. "Fiabilidad" es medir algo de forma consistente; mientras que
"validez" es medir lo que realmente se pretende medir. Ambas propiedades, fiabilidad
y validez, admiten un tratamiento matemtico.
28
GUA DIDCTICA
Presentacin
La gua de actividades del curso de Psicometra explicita la configuracin de las
situaciones didcticas, mediante la planificacin de actividades que permitan el
logro de metas de aprendizaje en las diversas fases del aprendizaje, con un sentido
crtico del cambio entre situaciones de entrada y de salida.
FASES DEL APRENDIZAJE
Fase de Reconocimiento
Corresponde a la interaccin entre los conocimientos previos y las nuevas
conceptualizaciones del curso.
Las actividades se enmarcan en situaciones didcticas que para la fase de
reconocimiento, por unidad, pueden corresponder a las siguientes posibilidades de
situaciones didcticas:
Actividad de induccin al curso, con acompaamiento tutorial en grupo. Medio para la
interactividad: Videoconferencia
Estudio independiente, individual o en pequeo grupo: identifica conceptos conocidos
y conceptos nuevos que necesitan posterior profundizacin.
Tutora sincrnica o asincrnica en grupo de curso sobre cada unidad temtica. Medio
para la interactividad: lista de distribucin en aula virtual o mural.
Tutora sincrnica o asincrnica individual: asesora para aclarar dudas en el proceso
de aprendizaje con el fin de seleccionar lneas apropiadas de identificacin de
conceptos para trabajar en su reconceptualizacin.
29
Tutora a pequeos grupos colaborativos para mejorar la estrategia de estudio.

Autoevaluacin y coevaluacin formativa.
Elaboracin de portafolio.
Fase de Profundizacin
Corresponde al desarrollo de actividades de aprendizaje que permiten analizar,
reconceptualizar y resignificar los conceptos encontrados en la fase de
reconocimiento.
Fase de Transferencia
Se orienta a aplicar el conocimiento a situaciones problmicas, toma de decisiones e
interacciones con otros campos disciplinares.
Segn cada caso particular de las temticas de las unidades, en estas fases
pueden aparecer todas o slo algunas de las situaciones didcticas referenciadas
en la fase de reconocimiento
TCNICAS E INSTRUMENTOS PARA LA OBJETIVACIN DEL APRENDIZAJE

En situaciones didcticas grupales
El estudiante y el tutor (cuando participa sincrnicamente en apoyo pedaggico de la
actividad), cumplirn el encuentro en fechas especificadas en la programacin
acadmica semestral previamente comunicada y socializada en la agenda de aula
virtual, y aplicarn como instrumento un formato que registre la actividad colectiva, en
el marco de objetivos explcitos y de resultados participativamente calificados. La
30
tcnica de apoyo pedaggico puede consistir, a nivel nacional, en

videoconferencia, combinacin
de
mural digital
(previamente diseado
enriquecido participativamente) con foro virtual dentro de das especficamente

asignados.
El instrumento incorporar en las conclusiones del encuentro, apreciaciones sobre:
logros, funcionalidad
de
la
tcnica grupal
desarrollada,
sugerencias
de
mejoramiento. En otros casos, se diligenciarn informes grupales a partir de guas de

prcticas o laboratorios, formatos grupales sobre solucin de situaciones problmicas
asignadas para trabajo colaborativo dentro de cada unidad temtica o como resultado
de la participacin en procesos de investigacin formativa, formatos de coevaluacin
para el caso de trabajo grupal colaborativo, etc.
DESCRIPCIN DE ACTIVIDADES
Las actividades de reconocimiento se manejan simultneamente para las unidades del
curso,
mediante
una
lectura
de
identificacin
de
los
contenidos,
correlacionndolos con los conocimientos y experiencias previas de los estudiantes y

las nociones nuevas que debe profundizar posteriormente.
En las actividades de profundizacin, el estudiante hace nfasis en interiorizar los
aspectos de conocimiento en que se encontr deficitario durante la fase de
reconocimiento. Para orientarlo en esta fase el tutor debe prescribir actividades
especficas destinadas a optimizar el proceso con relacin a las metas de aprendizaje.
31
UNIDAD I. HISTORIA Y CONCEPTOS BSICOS DE LA PSICOMETRA

Captulo 1. Historia de la Psicometra
La revisin de los antecedentes histricos y de la evolucin de la medicin en
psicologa, ofrece una perspectiva til para comprender la Psicometra actual. Para
algunos autores, la historia de los tests mentales es tal vez uno de los mejores
ejemplos de la existencia de una interaccin entre las demandas sociales y la
evolucin de una disciplina cientfica. La historia de la medicin psicolgica ha estado
marcada por la interrelacin entre la evolucin interna de la Psicometra y de la
Psicologa con el deseo de responder a las demandas sociales de cada
momento histrico, reflejando un mayor acento en las aplicaciones prcticas que en el
desarrollo terico.
Este apartado pretende esbozar el entorno intelectual y social en el que nace la

Psicologa moderna y con ella la Psicometra. A continuacin, slo se aborda una
de las dos lneas de trabajo que ms trascendencia han tenido para la evolucin de la
Psicometra: el estudio de las diferencias individuales; para la otra lnea: la Psicofsica,
se puede recurrir a la bibliografa complementaria del tema. Por ltimo, se sealan los
acontecimientos que han marcado la consolidacin de la disciplina.
Leccin 1. Antecedentes y formas rudimentarias de las pruebas psicolgicas
Conocer la historia de las pruebas psicolgicas es de gran importancia, los mayores

avances se comenzaron a dar durante la ltima parte del siglo XIX y la poca anterior
a la primera guerra mundial, pero el uso extendido de las pruebas es un fenmeno del
siglo XX.
Sin embargo existen datos histricos que muestran que las formas rudimentarias de
las pruebas psicolgicas datan aproximadamente del ao 2200 a. C., en China cuando
32
el emperador hizo que se examinaran a sus oficiales de gobierno cada tercer ao para
determinar su idoneidad para el cargo y por siglos se continuaron haciendo estas
pruebas modificndose y perfeccionndose hasta introducirse exmenes por escrito
durante la dinasta Han (200 d. C.). Ninguno de estos procedimientos de seleccin fue
validado.
El comienzo de las pruebas psicolgicas como tal se ha ubicado en la investigacin
experimental sobre las diferencias individuales que inici en Alemania y Gran Bretaa
terminado el siglo XIX siendo sus primeros representantes Wilhelm Wundt, Francis
Galln y James McKeen Cattell. Pero las pruebas psicolgicas le deben su comienzo
tanto a la primera psiquiatra como a los laboratorios de psicologa experimental. De
hecho, el examen de los enfermos mentales aproximadamente a mediados del siglo
XIX result en el desarrollo de muchas de las primeras pruebas (Bondy, 1974), las
cuales mostraban la ausencia de estandarizacin y, en consecuencia, se relegaron al
olvido. Sin embargo, influyeron en la determinacin del curso de las pruebas
psicolgicas, de modo que es importante mencionar algunos avances psiquitricos de
esta poca.
En 1885, el mdico alemn Hubert von Grashey desarroll el antecedente del cilindro
mnemnico como un medio para examinar a pacientes con lesin cerebral. Se les
mostraban a los sujetos palabras, smbolos o ilustraciones a travs de una ranura en
una hoja de papel que se mova lentamente sobre los estmulos, muchos pacientes
podan reconocer los estmulos completos, pero no identificarlos cuando se mostraban
a travs de la ranura en movimiento. Poco despus, el psiquiatra alemn Conrad
Rieger desarroll una batera de pruebas excesivamente ambiciosa para la deteccin
del dao cerebral, la cual requera ms de 100 horas para su aplicacin, por lo que
pronto cay su aceptacin. En resumen, la psiquiatra inicial contribuy al movimiento
de las pruebas mentales al mostrar que los procedimientos estandarizados pueden
ayudar a revelar la naturaleza y grado de los sntomas en pacientes con
enfermedades mentales y con lesin cerebral.
33
Leccin 2.Era de los instrumentos de bronce

La psicologa experimental floreci a finales del siglo XIX en la Europa continental y
Gran Bretaa. Por primera vez en la historia, los psiclogos se alejaron de los
mtodos totalmente subjetivos e introspectivos que se haban seguido de manera tan
infructuosa en siglos anteriores. En lugar de ello, las capacidades humanas se
sometieron a prueba en laboratorios. Los investigadores utilizaron procedimientos
objetivos que tenan posibilidad de replicarse. Lejos quedaron los das en que
laboratorios rivales tenan grandes discusiones acerca del "pensamiento sin
imgenes", donde un grupo afirmaba que exista, mientras otro deca que tal
acontecimiento mental era imposible.
Aunque el nuevo nfasis en los mtodos objetivos y las cantidades medibles era una
gran mejora sobre el mentalismo generalmente estril que le precedi, la nueva
psicologa experimental era, en s misma, un callejn sin salida, al menos en cuanto a
pruebas psicolgicas se refiere. El problema estaba en que los primeros psiclogos
experimentales confundieron los simples procesos sensoriales con la inteligencia.
Utilizaron diversos instrumentos de bronce para medir umbrales sensoriales y tiempos
de reaccin, pensando que dichas capacidades eran esenciales para la inteligencia.
De aqu que en ocasiones se llame a este periodo la era de los Instrumentos de
Bronce de las pruebas psicolgicas.
A pesar del falso comienzo de los primeros experimentalistas, al menos
proporcionaron una metodologa apropiada a la psicologa. Pioneros como Wundt,
Galton, Cattell y Wissler mostraron que era posible exponer a la mente al escrutinio y
la medicin cientfica. ste fue un cambio decisivo en las suposiciones axiomticas de
la psicologa, un cambio que ha permanecido hasta la actualidad.
La mayor parte de las fuentes le atribuyen a Wilhelm Wundt (1832-1920) la fundacin
del primer laboratorio psicolgico en 1879 en Leipzig, Alemania. Es menos sabido que
34
este investigador llevaba aos midiendo procesos mentales, al menos desde 1862,
cuando experiment con su medidor del pensamiento (Diamond, 1980). Este
instrumento era un pndulo calibrado con agujas que sobresalan a cada lado. El
pndulo oscilaba de un lado a otro, golpeando campanas con las agujas. La tarea del
observador consista en tomar nota de la posicin del pndulo cuando las campanas
sonaban. Por supuesto, Wundt poda ajustar de antemano las agujas y, por tanto,
conocer la posicin precisa del pndulo cuando tocaba cada campana. Wundt
consideraba que la diferencia entre la posicin observada del pndulo y la posicin
real poda proporcionar un medio para determinar la velocidad de pensamiento del
observador
Este anlisis de los informes de tiempos en telescopio parece simplista segn normas
actuales, y pasa por alto la posible contribucin de factores como la atencin,
motivacin y retroa-limentacin autocorrectora de los ensayos anteriores. En su lado
positivo, ste fue al menos un anlisis emprico que buscaba explicar las diferencias
individuales, en vez de tratar de deshacerse de ellas por medio de explicaciones. Y
sa es la relevancia para las prcticas actuales en cuanto a pruebas psicolgicas. A
pesar de lo rudimentario, Wundt midi los procesos mentales y reconoci a
regaadientes las diferencias individuales.
Primera batera de pruebas
Sir Francis Galton (1822-1911) fue el pionero de la nueva psicologa experimental en

la Gran Bretaa del siglo XIX. Estaba obsesionado con la medicin y su carrera
intelectual parece haberse visto dominada por la creencia de que poda medirse casi
cualquier cosa. Sus intentos por medir el intelecto a travs del tiempo de reaccin y de
tareas de discriminacin sensorial son muy conocidos. Sin embargo, para apreciar sus
amplios intereses, el lector debera estar enterado de que Galton tambin dise
tcnicas para medir la belleza, la personalidad, el nivel de aburrimiento de una lectura
y la eficacia de la oracin, por nombrar slo unas cuantas.
35
Pero finalmente Galton demostr una y otra vez que las diferencias individuales no
slo existen, sino que se pueden medir de manera objetiva, el tom prestados los
lentos procedimientos psicofsicos practicados por Wundt y otros investigadores en el
continente europeo, y los adapt a una serie de medidas sensorio-motoras simples y
rpidas. As, continu con la tradicin de los instrumentos de bronce en las pruebas
mentales, pero con una importante diferencia: sus procedimientos fueron ms adecuados para la oportuna recoleccin de datos de cientos, si no es que miles, de
sujetos. Debido a sus esfuerzos para disear medidas viables de las diferencias
individuales, en general, los historiadores de las pruebas psicolgicas consideran a
Galton como el padre de las pruebas mentales.
En ltima instancia, los intentos simplistas de Galton por estimar el intelecto con medidas de tiempo de reaccin y discriminacin sensorial resultaron infructuosos. Sin
embargo, proporcion un enorme mpetu al movimiento de evaluacin al demostrar
que podan disearse pruebas objetivas y obtenerse puntuaciones significativas a
travs de procedimientos estandarizados
Pruebas de bronce en EUA
James McKeen Cattell (1860-1944) estudi la nueva psicologa experimental tanto con
Wundt como con Galton, antes de establecerse en la Columbia University.
Despus de tener correspondencia con Galton durante algunos aos, Cattell obtuvo
una beca de dos aos en Cambridge, de modo que pudiera continuar con el estudio
de las diferencias individuales. Cattell abri su propio laboratorio de investigacin y
desarroll una serie de pruebas que eran principalmente extensiones y adiciones a la
batera de Galton.
Cattell (1890) invent el trmino prueba mental en su famoso artculo intitulado
"Mental Tests and Measurements ". Este artculo describa su programa de
investigacin, detallando 10 pruebas mentales que l propona para su utilizacin con
el pblico en general. Estas pruebas eran con toda claridad elaboraciones per-
36
feccionadas de la tradicin de Galton.

En 1891, Cattell acept un puesto en la Columbia University, que en aquel entonces
era la universidad ms grande de EUA. Su posterior influencia sobre la psicologa
estadounidense super en mucho a sus resultados cientficos individuales y se
expres en gran parte a travs de sus numerosos e influyentes alumnos (Boring,
1950). Entre sus muchos y famosos estudiantes de doctorado y los aos en que
obtuvieron sus ttulos se encuentran E. L. Thorndike( 1898), quien realiz
contribuciones monumentales a la teora del aprendizaje y a la psicologa educativa;
R. S. Woodworth (1899), quien fue el autor del muy popular e influyente Experimental
Psychology (1938); y E. K. Strong (1911), cuyo Vocational Interest Blank revisado
desde entonces todava tiene amplio uso. Pero entre los alumnos de Cattell, probablemente fue Clark Wissler (1901) quien tuvo la mayor influencia en la historia inicial
de las pruebas psicolgicas.
Wissler quiso relacionar los resultados de las pruebas mentales elaboradas con el
desempeo acadmico de 300 estudiantes universitarios esperando que la prueba
mental fuera un predictor del desempeo acadmico, pero los resultados de Wissler
(1901) mostraron que virtualmente no haba una tendencia a que las puntuaciones de
una prueba mental se correlacionaran con el rendimiento acadmico. Por ejemplo, la
posicin dentro de la clase se correlacion en .16 con la memoria de listas de
nmeros, -.08 con la fortaleza en el dinammetro, .02 con c! nombrado du colores y .02 con el tiempo de reaccin. La correlacin ms alta (.16) fue estadsticamente significativa debido al gran tamao de la muestra. Sin embargo, una correlacin tan
pequea lleva consigo muy poca utilidad predictiva.
Este tipo de resultados provocaron en los experimentalistas un alejamiento del enfoque de los instrumentos de bronce lo cual fue una evolucin deseable en la historia de
las pruebas psicolgicas y con ello se facilit el camino para la aceptacin inmediata
de las medidas ms sensatas y tiles como las de Binet para los procesos mentales
superiores.
37
Leccin 3. Estudio de las diferencias individuales e importancia de las pruebas

Debemos advertir de una doble simplificacin. Primera, dejar a un lado, por razones
de tiempo, la Psicofsica que impide lograr una visin comprehensiva de la historia de
la medicin en Psicologa; segunda, reducir la historia del estudio de las diferencias
individuales a la historia de los tests psicolgicos y presentarla recurriendo a las
aportaciones de algunas figuras clave. La ltima es reduccionista pero difcil de evitar:
gran parte de la Psicometra actual no se puede comprender sin atender a los
antecedentes y orgenes histricos de los tests psicolgicos y de la medida de la
inteligencia.
El rpido progreso econmico y social en la Europa de finales del siglo XIX plante la
necesidad de evaluar las capacidades y conocimientos de los individuos en contextos
educativos, laborales, etc. Si la Filosofa y la Fisiologa fueron las disciplinas que ms
influyeron en el trabajo de los primeros psicofsicos, el impacto ms dramtico sobre
el estudio de las diferencias individuales vino de la Biologa. Al tiempo que Fechnner
presentaba sus trabajos, Darwin (1809-1882) present su teora en La Evolucin de
las Especies (1859) y su aplicacin al estudio del hombre en El origen del hombre y la
seleccin en relacin al sexo (1871). Darwin defendi que la inteligencia y el sentido
moral tambin se haban ido perfeccionando de manera gradual a travs de la
seleccin natural. Al defender esta idea Darwin no haca sino reflejar la visin
cientfica y la opinin popular dominante en la Inglaterra del siglo XIX, que justificaba
el colonialismo y el sistema de clases bajo la creencia de que el hombre de letras
ingls de clase media era el pico de la evolucin humana (Rust y Golombok,
1989).
No es exagerado afirmar que las necesidades de la evaluacin educativa fueron las

primeras demandas sociales con un impacto significativo y duradero en la evolucin
38
del estudio de las diferencias individuales y, por ende, de la Psicometra. Los intentos
por medir la inteligencia como respuesta a esas demandas caminan de la mano de los
desarrollos metodolgicos durante este periodo.
Thorndike (1997) seala el movimiento hacia la educacin obligatoria en Francia,

Inglaterra y Estados Unidos a finales del siglo XIX, como uno de los desarrollos
crticos que propiciaron la medida de la inteligencia. La llegada por primera vez a
las escuelas de nios cuyos padres no haban recibido una educacin o, como en el
caso americano, cuya lengua materna no era el ingls, gener una
heterogeneidad en la poblacin de alumnos como antes no se haba conocido. La
exposicin de estos nios a un currculo antiguo, diseado para un grupo selecto
de estudiantes, trajo como resultado niveles dramticos de fracaso escolar
prximos al 50%. Este fracaso fue visto como una prdida de recursos en un
tiempo en que eran limitados, de forma que se plante la necesidad de destinar los
recursos a quienes ms se pudieran beneficiar, el medio: la evaluacin de la
inteligencia. Este es el contexto en el que se debe situar la obra de Binet.
Los pioneros de la Psicologa llevaban aos intentando una formulacin aceptable de

la inteligencia. Segn Rust y Golombok (1989) los primeros autores tenan unas
definiciones de la inteligencia que no iban ms all de lo que podra ser la
psicologa popular del maestro comn de escuela. Se reconoca la diferencia entre
una persona educada y una persona inteligente, entendiendo esta ltima como una
persona "educable", con un origen esencialmente gentico y receptora ideal de los
recursos educativos, frente a los "torpes" incapaces de beneficiarse de la educacin
normal.
Entre los pioneros en el estudio de las diferencias individuales destaca el considerado

por muchos autores, como el fundador de la Psicometra: Francis Galton. Primo de
39
Darwin,
inici
sus
investigaciones
llevado
por
el
objetivo
de mostrar el
componente hereditario del "genio". Para ello reuni el primer banco con los datos
de
personas
relacionadas y
no relacionadas. Influido por el
asociacionismo de Locke y llevado por sus observaciones de que las personas con
deficiencias mentales presentaban una peor ejecucin a la hora de discriminar
sensaciones de fro, calor, dolor, etc., pens que la discriminacin sensorial poda ser
el medio para cuantificar el intelecto de una persona. Sus aportaciones propiamente
metodolgicas abarcan la formulacin de las bases de procedimientos estadsticos,
como el coeficiente de correlacin desarrollado por K. Pearson (1857-1936), las
intuiciones sobre la forma de "campana", como imagen para describir la distribucin
de puntuaciones en un test, as como las primeras aplicaciones de las escalas
de "rating" y los mtodos de cuestionario (Anastasi y
Urbina, 1997).
J. M. Catell (1860-1944) trabajo con Wundt, con quien comparti el inters por los
fenmenos perceptivos y sensomotores, y el rigor en el control de las condiciones
en que se realizaban las observaciones, pero de quin se distanci ante el
despreci del experimentalista alemn por las diferencias individuales. Ms tarde
trabajo con Galton e inici en Estados Unidos el estudio de las diferencias
individuales. Acu el trmino "test mental" en un artculo publicado en 1890 en la
revista Mind bajo el ttulo Mental test and measurements. Asumi la idea de
Galton sobre la posibilidad de medir las funciones intelectuales por medio de tests de
discriminacin sensorial y tiempo de
reaccin. Sin embargo, los primeros
estudios que se realizaron para evaluar este tipo de tests ofrecieron resultados
desalentadores: el "rendimiento intelectual" mostraba poca correspondencia de
unos tests a
otros y
prcticamente ninguna
relacin con estimaciones
independientes del nivel intelectual realizadas por los profesores. Por el contrario,
Ebbinghaus, apuntando ya un cambio de enfoque, haba obtenido con un test de
40
terminacin de frases una correspondencia clara con el rendimiento acadmico de los

nios.
Pero sin duda, la consolidacin social de la medicin psicolgica vino de la obra del
francs Alfred Binet (1857-1911) cuya influencia en el desarrollo de la teora de los
tests perdura en la actualidad. Binet a finales de los aos noventa del siglo XIX critic
la aproximacin de Galton y Cattell con el argumento de que para medir procesos
mentales complejos era necesario observar la ejecucin de los individuos en actos
mentales complejos, rechazando la idea de que fuese necesaria una mayor
precisin para la que no haba instrumentos disponibles, ya que las diferencias
individuales eran mayores respecto a los procesos superiores que en cuanto a la
discriminacin sensorial.
Tras las aportaciones de Binet, los mayores desarrollos en la medicin de las

diferencias individuales hay que buscarlos en un rea y lugar diferente. El test de Binet
fue introducido en Estados Unidos por H. H. Goddard, cuya traduccin y adaptacin
recibieron el beneplcito de la audiencia mdica, al venir a cubrir la necesidad de una
medida estandarizada y objetiva para el diagnstico de la subnormalidad. Sin
embargo, fue rpidamente desplazada por la revisin y adaptacin psicomtricamente
ms slida, realizada por L. M. Terman en 1916 en la Universidad de Stanford. Al
entrar Estados Unidos en la Primera Guerra Mundial, un comit encabezado por R. M.
Yerkes detecta la necesidad de clasificar de forma rpida al milln y medio de reclutas
con respecto a su nivel intelectual. De nuevo, una demanda social provoca un avance
metodolgico: los primeros tests de inteligencia de administracin grupal y no
verbales, para evaluar a los reclutas analfabetos o que no tenan como lengua
materna el ingls. En este contexto hay que situar las contribuciones de A. S. Otis, por
la introduccin del formato de eleccin mltiple y otros formatos de puntuacin
objetiva. Impulsado por las necesidades militares aparece tambin el primer test
41
estandarizado para la evaluacin de variables de personalidad: el Personal Data

Sheet de R. S. Woodworth,
un
instrumento
la
de
personas con inestabilidad emocional.
deteccin
pensado
para
Importancia de las pruebas
Las pruebas
se utilizan en casi todos los pases con propsitos de orientacin
psicolgica, seleccin y asignacin, los contextos de aplicacin son diversos como por
ejemplo en colegios, universidades, servicio pblico, centros de orientacin
psicolgica, industrias, clnicas y hospitales.
Prcticamente desde que se ingresa al sistema escolar, se comienzan a tomar
pruebas. La mayora de las personas han tomado un gran nmero de pruebas y no les
han dado mayor importancia. Pero es posible observar que para la edad de
pensionarse, el destino una persona sin saberlo ha sido moldeado por las pruebas que
ha presentado a lo largo de su vida.
Los resultados de las pruebas psicolgicas pueden alterar profundamente el futuro de
una persona. As, el haber sido admitido en una universidad y no en otra, ser aceptado
en un empleo y rechazado en otro, ser diagnosticado con depresin o un trastorno de
personalidad, que no se encuentre ningn trastorno, todas estas decisiones dependen
del criterio o interpretacin de individuos expertos con poder de decisin.
Leccin 4. Influencia de las primeras investigaciones sobre inteligencia
En 1896, Binet y su ayudante en la Sorbona, Victor Henri, publicaron una revisin

fundamental de los trabajos alemanes y estadounidenses sobre diferencias
individuales. En este artculo, que posee gran importancia histrica, discutieron que la
inteligencia poda medirse mejor a travs de los procesos psicolgicos superiores que
42
con procesos sensoriales elementales, como el tiempo de reaccin, despus de varios

inicios en falso, Binet y Simn llegaron en un momento dado al sencillo formato de sus
escalas de 1905, que se analizan ms adelante.'* El carcter de la escala de 1905 le
debe mucho a una prueba anterior elaborada por el Dr. Blin (1902) y a su alumno M.
Damaye. Estos investigadores haban intentado mejorar el diagnstico del retraso
mental a travs del uso de una batera de evaluacin en 20 reas como lenguaje
hablado, conocimiento de las partes del cuerpo, obediencia a rdenes simples;
nombrado de objetos comunes y capacidad para leer, escribir y hacer clculos
aritmticos sencillos. Binet critic la escala por considerarla demasiado subjetiva, por
tener reactivos que reflejaban la educacin formal y por utilizar un formato de s o no
en muchas preguntas (DuBois, 1970). Pero se mostr sumamente impresionado por la
idea de utilizar una batera de pruebas, una caracterstica que adopt en sus escalas
de 1905
En 1904, el ministro de Educacin Pblica en Pars (Minister of Public Instructiva)
estableci una comisin para decidir sobre las medidas educativas que deberan
emprenderse con aquellos nios que no podan beneficiarse de la educacin regularla
comisin concluy que deberan utilizarse exmenes mdicos y educativos para
identificar a aquellos nios que no podan aprender a ti uves de mtodos regulares. Lo
que es ms, se determin que se debera retirar a estos nios de las clases regulares
y darles instruccin especial, adecuada a su habilidad intelectual ms limitada. Este
fue el principio de las clases de educacin especial.
Era evidente la necesidad de un medio para seleccionar los nios para tal asignacin
especial y se le solicit a Binet y a su colaborador Simn que desarrollaran una
herramienta prctica dirigida nicamente u dicho propsito. As surgi la primera
escala formal para evaluar la inteligencia de los nios.
Existen cuatro maneras en que la escala de 1905 difera con respecto a aqullas
construidas antes:
1. No afirmaba medir precisamente ninguna facultad en particular. Ms bien, se diriga
43
a evaluar el desarrollo mental general del nio con un grupo heterogneo de tareas.
As, la meta no era la medicin, sino la clasificacin.
2. Era una prueba breve y prctica. Tomaba menos de una hora para su aplicacin y
requera pocos elementos en cuanto a equipo.
3. Meda de manera directa lo que Binet y Simn consideraban como el factor esencial
de la inteligencia el juicio prctico en lugar de perder el tiempo con capacidades
de menor nivel que implicaran elementos sensoriales, motores o perceptuales. As,
miran una perspectiva prctica de la inteligencia.
4. Los reactivos estaban distribuidos segn su nivel aproximado de dificultad, en vez de
en funcin del contenido. Se realiz una estandarizacin preliminar con 50 nios
normales cuyas edades iban de 3 a 11 aos y tambin con varios nios subnormales y
con retraso.
Las 30 pruebas en la escala de 1905 iban de las pruebas sensoriales abiertamente
simples, a las abstracciones verbales bastante complejas., As, la escala era
apropiada para evaluar la gama completa de la inteligencia desde el retraso mental
grave hasta los niveles superiores de la inteligencia dotada.
Un punto interesante que con frecuencia pasan por alto los alumnos de psicologa en
la actualidad, es que Binet y Simn no ofrecieron en su escala de 1905 un mtodo
preciso para llegar a una puntuacin total. Sera bueno recordar que su propsito era
la clasificacin, no la medicin, y que su motivacin era completamente humanitaria,
es decir, la de identificar a aquellos nios que necesitaban asignarse a educacin
especial. Segn normas contemporneas, es difcil aceptar la confusin inherente a
dicho enfoque, pero ello puede reflejar una inclinacin moderna hacia la cuantificacin
ms que una debilidad por parte de la escala de 1905. De hecho, su escala fue
popular entre los educadores en Pars. Incluso en ausencia de una cuantificacin
precisa, el enfoque fue exitoso en la seleccin de candidatos para clases especiales.
En 1908, Binet y Simn publicaron una revisin de la escala de 1905. En la escala
anterior, ms de la mitad de los reactivos haban sido diseados para los individuos
44
con retraso muy notable; sin embargo, las principales decisiones diagnsticas
implicaban a nios mayores y a personas con un intelecto limtrofe. Para remediar este
desequilibrio, se abandon la mayor parte de los reactivos muy simples y se aadieron
nuevos al extremo superior de la escala.
La principal innovacin de la escala de 1908 era la introduccin del concepto de nivel
mental. Las pruebas se haban estandarizado con crea de 300 nios normales entre
3 y 13 aos de edad. Esto permiti que Binet y Simn ordenaran las pruebas segn el
nivel de edad en el que por lo comn se aprobaban. Cualesquiera reactivos que
aprobaran de 80 a 90% de los nios de tres aos, se asignaba al nivel de 3 aos
hasta los 13.
En 1911 apareci una tercera revisin de las escalas Binet-Simon. Ahora, cada nivel
de edad tena exactamente cinco pruebas. La escala tambin se extendi hasta el
rango adulto. Binet introdujo nuevos mtodos de calificacin que concedan una quinta
parte de un ao por cada subprueba aprobada por encima del nivel basal. En sus
escritos, Binet enfatiz en gran medida que no debera tomarse demasiado en serio el
nivel mental exacto del nio como una medida absoluta de la inteligencia.
Sin embargo, la idea de obtener un nivel mental fue un desarrollo monumental que habra de influir el carcter de las pruebas de inteligencia a lo largo del siglo XX.
Despus de unos cuantos meses, lo que Binet llam nivel mental se traduca como
edad mental. Y los examinadores en todas partes, incluyendo Binet mismo,
comparaban la edad mental de un nio con su edad cronolgica. As, un nio de nueve aos que funcionaba al nivel el mental (o edad mental) de un nio de seis aos,
tena un retraso de tres aos.
En 1916, Terman y sus colaboradores en Stanford revisaron las escalas Binet-Simon y

produjeron la Stanford-Binet, una exitosa prueba. Terman sugiri multiplicar el
Cociente de Inteligencia por 100 para eliminar las fracciones; tambin fue la primera
45
persona en utilizar la abreviatura CI. As naci uno de los conceptos ms populares y

polmicos de la historia de la psicologa. Binet muri en 1911, antes de que el CI se
generalizara en las pruebas estadounidenses.
Leccin 5. Consolidacin institucional de la Psicometra

De forma paralela a los avances tericos y las aplicaciones prcticas, se fue
produciendo la consolidacin institucional de la Psicologa y, claro est, de la propia
Psicometra. Esta consolidacin se refleja en la creacin de asociaciones
profesionales, de publicaciones especializadas para la comunicacin entre
profesionales y de empresas privadas dedicadas desde el inicio al floreciente negocio
de la evaluacin psicolgica.
J. Jastrow habla sobre los tests en la primera convencin de la American

Psychological Association (APA) en 1892. La APA form en 1895 un comit
especializado en la nueva tecnologa de los tests. En 1899 Kilpatrick, presidente de la
APA, realiz un llamamiento a los psiclogos para que elaborarn tests de tal
naturaleza que "... pudieran ser aplicados tanto a nios como adultos, que fueran
de tal forma que todas las personas tuvieran las mismas oportunidades de mostrar las
capacidades examinadas, y que en aras de la economa del tiempo fueran diseados
de forma que se pudieran administrar a una clase o escuela de una vez" (Thorndike,
1997, pg. 6). Impulsado por la figura clave de Terman el uso de los tests de
inteligencia en las escuelas creci rpidamente. El propio Terman calcul que en el
periodo entre 1920 y 1921 ms de dos millones de nios haban respondido a un test
de inteligencia. El uso de test tambin se extendi al mundo laboral como prueba su
incorporacin a las prcticas de seleccin de la administracin americana.
Cattell fund la Psychological Corporation para la produccin industrial de tests en
46
1922. En 1947 se funda el Educational Testing Service (ETS) institucin sin animo de
lucro que no slo se ha encargado de la produccin de tests estandarizados de
rendimiento y tests de aptitud acadmica, sino que desde su constitucin, ha
contribuido a la formacin y prctica profesional de influyentes psicmetras. Desde
1975, el ETS edita en formato CD-ROM el proyecto ERIC donde con una
periodicidad anual se recoge la informacin disponible sobre tests, escalamiento y
medicin psicolgica y educativa.
Galton, Pearson y Weldon fundaron en 1901 la revista Biometrika que desde entonces
publica trabajos matemticos relacionados con la Biologa y la Psicologa. Thorndike
funda en Estados Unidos en 1936 la publicacin Psychometrika, revista de referencia
para la Psicometra desde sus inicios. Desde entonces, la aparicin de revistas
relacionadas con la medicin psicolgica ha sido continua. Como muestra se pueden
citar el Educational and Psychological Measurement (1941), el British Journal of
Statistical Psychology (ahora con el nombre de British Jorunal of Statistical and
Mathematical Psychology) (1947), el Journal of Mathematical Psychology y el Journal
of Educational Measurement (1964), el Multivariate Behavioral Research y el Aplied
Psychological Measurement (1977), el Applied Measurement in Education (1988), etc.
Un acontecimiento que se ha convertido en referente obligado para todos los

profesionales es la publicacin por las asociaciones profesionales ms relevantes
de las guas tcnicas y ticas de la medicin psicolgica y educativa. Las
recomendaciones elaboradas por la APA son, sin duda, las que han tenido y tienen
una mayor influencia.
Entonces
La psicometra es la ciencia de la medida de los aspectos "psicolgicos" de una
persona, tales como conocimiento, habilidades, capacidades, o personalidad. La
medida de estos aspectos es difcil, y gran parte de la investigacin y tcnicas
47
de cuantificarlos. Los primeros trabajos de psicometra se desarrollaron para medir la
inteligencia. Posteriormente, la teora psicomtrica se ha aplicado a la medida de
otros aspectos como la personalidad, actitudes y creencias, rendimiento acadmico, y
en campos relacionados con la salud y la calidad de vida.
Los contenidos de la psicometra se articulan, fundamentalmente, en dos grandes
bloques: teora de los test, que hace referencia a la construccin, validacin y
aplicacin de los test, y escalamiento, que incluye los mtodos para la elaboracin de
escalas psicofsicas y psicolgicas. A su vez, la teora de los test se divide en dos
ramas: la teora clsica de los tests y la ms reciente teora de respuesta a los tems.
Los conceptos clave de la teora clsica de los tests son: confiabilidad y validez.
"confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo
que realmente se pretende medir. Ambas propiedades admiten un tratamiento
matemtico.
La consistencia interna puede calcularse por correlacin entre distintos tests. Los
mtodos ms conocidos se denominan: mtodo de las formas paralelas, mtodo
del test-retest y mtodo de las dos mitades.
La validez puede calcularse correlacionando las mediciones con las de una medida
patrn aceptada como vlida. Se distinguen los siguientes aspectos: validez de
contenido, validez predictiva y validez de constructo.
Complemente y discuta con el profesor el artculo anexo La medicin de lo
Psicolgico
(que
se
encuentra
http://www.psicothema.com/pdf/138.pdf)
en
la
siguiente
pgina
48
Capitulo 2. La Psicometra y su Mtodo

Leccin 6. Definicin de psicometra
Disciplina implicada directamente en la medicin psicolgica, con una doble vertiente:
terica : supone la fundamentacin terica de la medida

prctica: supone la construccin, evaluacin y aplicacin de instrumentos de
medida para evaluar o medir las caractersticas psicolgicas de inters.
Ms adelante se seguir ampliando el concepto de Psicometra, explicaremos a

continuacin algunos aspectos de la vertiente prctica de la psicometra. Se sugiere a
los estudiantes hacer la bsqueda por Internet de la vertiente terica de la
psicometra (pueden tambin buscar en la red con la palabra clave psicologa
matemtica).
Leccin 7. Vertiente prctica de la psicometra
Fase de Construccin de un Instrumento de Medida
En esta fase del proceso habra que cubrir las siguientes etapas:
Delimitacin y operativizacin de la variable psicolgica que se desea medir
Confeccin de los tems
Determinacin del valor escalar de los tems
Confeccin de la prueba
Esta fase subsumira lo que tradicionalmente se entiende al hablar de

escalamiento, el escalamiento de estmulos psicolgicos
Una vez completada la fase de construccin se pasara a la de la evaluacin del
instrumento construido para, finalmente, concluir con la administracin efectiva del
49
instrumento a un sujeto (o grupo de sujetos) en la fase de aplicacin.

Fase de Evaluacin de un Instrumento de Medida
La fase de evaluacin del instrumento de medida es absolutamente crucial ya que
todas las medidas obtenidas al aplicar una prueba contienen error.
La consideracin del error de medida inherente a toda medicin psicolgica hace
necesario:
un planteamiento explcito acerca de hasta qu punto la medida obtenida en un

momento determinado proporciona una estimacin adecuada del nivel real en que
posee el sujeto la caracterstica psicolgica que supuestamente se est evaluando.
Por tanto, la consideracin del error de medida exige el recurso a una teora de los
tests que d cuenta del mismo y proporcione una estimacin del rasgo o
caracterstica evaluada.
la evaluacin de la calidad de los instrumentos de medida, es decir, determinar si

stos cumplen o no los criterios mtricos de calidad que todo instrumento de
medida debe de satisfacer para poder ser utilizado con garanta como un
instrumento
cientfico.
Esto supone que habr que estudiar confiabilidad y validez de la prueba y proceder
al anlisis de los tems de la misma.
Una vez construida y evaluada positiva o favorablemente la prueba, nos
enfrentaramos a la tercera fase del proceso: su aplicacin a un sujeto o a una
muestra de sujetos.
Fase de Aplicacin de un Instrumento de Medida
Una vez construida y evaluada positiva o favorablemente la prueba, nos
enfrentaramos a la tercera fase del proceso: su aplicacin a un sujeto o a una
50
muestra de sujetos.
El objetivo de esta fase es obtener una medida de cada sujeto o grupo en el rasgo o
caracterstica evaluada por la prueba, determinar el valor escalar de cada sujeto o
grupo de sujetos, viendo la posicin que stos ocupan en el continuo que
representa la caracterstica o rasgo evaluado con el instrumento de medida.
En particular, los contenidos del programa vinculados con esta fase son:
la interpretacin de las puntuaciones del test

la equiparacin de las puntuaciones del test.
La Psicometra y la Teora de los Tests

La finalidad de este tema es presentar la Psicometra e introducir uno de sus
contenidos ms importantes: la Teora de Tests.
Intentar definir un concepto complejo como el de "Psicometra", al igual que ocurre con
la denominacin de cualquier disciplina cientfica, es una tarea difcil, razn por la que,
al contrario de lo que se podra pensar, no abundan las definiciones explcitas. Bajo la
palabra "Psicometra" pueden convivir contenidos, enfoques, objetivos y hasta
concepciones diferentes sobre la ciencia y la funcin social de la Psicologa. Por todo
ello, tal vez la nica estrategia til para abordar una delimitacin conceptual
comprehensiva y lo ms exacta posible de la Psicometra sea recorrer desde una
perspectiva histrica la evolucin de la medicin psicolgica, esbozar un anlisis
de la naturaleza del "objeto" de la medicin psicolgica,
psicomtrico, presentar
los
contenidos
de
describir
el
mtodo
la Psicometra y, a pesar de las
dificultades ... no resistir la tentacin final de proponer una definicin propia de la

Psicometra.
51
Leccin 8. Definiciones y objetivo de la Psicometra
En este apartado se aborda el significado de la denominacin de la disciplina y se

sealan los elementos comunes de las definiciones propuestas por diferentes autores.
El trmino "Psicometra" es el ms extendido y general para hacer referencia a la

medicin psicolgica. Su significado popular y la etimologa de la palabra apuntan
en la misma direccin: la disciplina que se encarga de la medicin en Psicologa.
De hecho, los diccionarios de uso ms comn como el de la Real Academia de la
Lengua o el de Mara Moliner tambin coinciden en su significado: la medida de los
fenmenos psquicos.
Para avanzar en el camino hacia una delimitacin conceptual de la disciplina es
necesario detenerse en las definiciones explcitas que, desde la propia Psicologa, se
han propuesto para la Psicometra. Sealar los puntos comunes y las diferencias de
matiz entre ellas puede ayudar a entender el alcance de la disciplina.
La Psicometra se ocupa de todas las medidas en el campo psicolgico,

habindose desarrollado a travs de dos ramas principales: los mtodos
psicofsicos y la teora de los tests. Tambin se define a la Psicometra como la
metodologa encargada del desarrollo y utilizacin de las tcnicas de medicin en
todos los mbitos de la psicologa.
Muiz (1998) define la Psicometra como "... el conjunto de mtodos, tcnicas y

teoras implicadas en la medicin de variables psicolgicas... lo especfico de la
Psicometra sera su nfasis y especializacin en aquellas propiedades mtricas
exigibles a las mediciones psicolgicas independientemente del campo sustantivo
de aplicacin y de los instrumentos utilizados".
52
La definicin de Martnez-Aras (1984) introduce un matiz que apunta hacia la relacin

entre la Psicometra y la Psicologa Matemtica. Para la autora, la Psicometra "...
aglutina todo el conjunto de modelos formales que posibilitan la medicin de variables
psicolgicas, centrndose en las condiciones que permiten llevar a cabo todo proceso
de medicin en psicologa".
No resulta difcil entresacar los elementos comunes de las definiciones anteriores. La

Psicometra es una disciplina metodolgica, sin un contenido psicolgico propio, pero
con un campo sustantivo: la teora de la medicin en sentido amplio. Muiz (1998)
afirma que el trabajo psicomtrico tiene como finalidad construir y utilizar
adecuadamente los tests y las escalas, de tal modo que se garantice su fiabilidad,
validez y aplicacin adecuada.
El objeto de la medicin en Psicologa
Al presentar las definiciones explcitas de la Psicometra elaboradas por diferentes
autores, se entresacaron sus elementos comunes: disciplina metodolgica, sin
contenido psicolgico propio, pero con un dominio sustantivo: la teora de la medicin
psicolgica en un sentido amplio. La definicin de Muiz (1998) seala adems, el
rasgo definitorio de la preocupacin psicomtrica por la medida: las condiciones
mtricas exigibles a todas medicin. Sin embargo, hay otra fuente de singularidad en
la preocupacin psicomtrica por las condiciones mtricas de la medicin que no es
posible soslayar: la que viene impuesta por la peculiaridad de los objetos psicolgicos
de medicin.
A diferencia de las variables fsicas, las variables psicolgicas no se pueden observar
de manera directa. No quiere esto decir, que en psicologa no se midan conductas
directamente observables, cuya cuantificacin se suele obtener a travs de alguno de
sus parmetros: duracin, frecuencia, intensidad, etc., sino que, incluso en estos
casos, la conductas observables se interpretan como indicios o resultado de variables
53
inobservables ms complejas. Atributos como "autoestima", "habilidad lectora",

"razonamiento analgico", etc., son variables inobservables que slo es posible medir
por medio de los comportamientos observables a los que den lugar.
Hay un amplio consenso sobre el trmino con el que referirse de forma genrica a los
objetos de medicin: constructos. El trmino "constructo" se ha hecho familiar en el
campo de la medicin psicolgica desde su utilizacin en el artculo de L. Cronbach y
P. E. Meehl titulado "Construct validity in Psychological Test" (1955). Cronbach y
Meehl (1955) entendieron por constructo un instrumento intelectual para organizar
la experiencia en categoras. Crocker y Algina (1986) lo definen como "...
productos de la imaginacin informada de los cientficos sociales qu intentan
desarrollar teoras para explicar el comportamiento humano" (pg. 4).
Crocker y Algina (1986) ilustran el proceso de elaboracin de constructos
insistiendo en su papel de "etiqueta" para resumir comportamiento y remarcan la
importancia de establecer alguna regla de correspondencia entre el constructo y los
comportamientos observables que son sus indicadores legtimos. La dificultad a la
hora de encontrar la conexin "legtima" entre el constructo y sus indicadores
comportamentales es valorada como uno de los lastres que impide el desarrollo de la
medida psicolgica.
Lord y Novick (1968) fijaron la definicin obligatoria de los constructos como requisito
previo para su medicin. La definicin de los constructos se debe abordar a dos
niveles:
Definicin operacional o semntica. Consiste en enumerar la serie de

comportamientos
indicadores
que
engloba
el
constructo.
Dichos
comportamientos son considerados los indicadores empricos del constructo

objeto de la medicin. La importancia de la definicin operacional es evidente:
debe conectar la etiqueta verbal con los datos observables.
54
Definicin conceptual o sintctica. Recoge la teora sobre el constructo
objeto de la medicin. Se trata de un discurso conceptual en el que se hacen

explcitas las relaciones del constructo objeto de la medicin con otros constructos
y/o indicadores empricos de otros constructos con los que el objeto de la medicin
est relacionado.
La definicin de los constructos a los dos niveles anteriores es el primer paso

inexcusable a la hora de iniciar cualquier medicin.
-
El supuesto sobre la estabilidad de los constructos
La medicin psicolgica asume, o al menos tiene en cuenta, algunos supuestos sobre

la naturaleza del objeto de la medicin, es decir, sobre la naturaleza de los
constructos. Sin duda, el supuesto comn a la prctica totalidad de los modelos de
medicin es el de la estabilidad de la variable.
Numerosos estudiosos de la medicin psicolgica defienden la idea de que las

diferentes versiones de la teora de los tests (e. g., la teora clsica, la teora de la
generalizabilidad y la teora de respuesta al tem) estn elaboradas para hacer
inferencias con el mismo "esqueleto": la tendencia de las personas a comportarse
de manera prescrita en situaciones prescritas a partir de sus repuestas a un
conjunto de tareas predeterminadas. Por ejemplo, la perspectiva tradicional para medir
la inteligencia responde a este esquema inferencial: empleo de tests estandarizados,
compuesto por tems o tareas predeterminadas, aplicados bajo condiciones
estandarizadas y con la pretensin de predecir el rendimiento futuro de las personas
en situaciones igualmente "estandarizadas": la escuela, el trabajo, el ejercito, etc., En
definitiva, los modelos de medida se han elaborado bajo el supuesto de estabilidad de
la variable.
55
El supuesto de estabilidad est siendo amenazado por las perspectivas ms recientes

sobre la evaluacin psicolgica, es decir, por la necesidad de extender el "paradigma
metodolgico tradicional" para responder, por ejemplo, a las inferencias que el
paradigma cognitivo plantea sobre las personas: las formas de uso y adquisicin de
conocimientos y habilidades, en definitiva, para modelar el cambio.
La polmica sobre el objeto de la medicin
La cuestin sobre la naturaleza del objeto no ha estado exenta de debate a lo largo de

la historia de la medicin psicolgica como reflejo de las discusiones sobre el propio
objeto de estudio de la psicologa. Resulta difcil evitar plantearse preguntas como las
lanzadas por Meli (1990): "Cuntos atributos latentes o rasgos subyacentes
existen?... en qu medida son estables o evolucionan? son comunes a todas
las personas?" (pg. 37).
Rust y Golombok (1989) defienden que la discusin sobre el objeto de medicin ha
dividido a la Psicometra en dos escuelas: la Psicometra del rasgo y la Psicometra
funcional. Spearman (1904, 1907) da carta de naturaleza a la Psicometra de los
rasgos al plantear que la esencia de la tarea de la medida mental es identificar rasgos
a travs de las tendencias de los individuos a comportarse de formas prescritas
en situaciones prescritas. El fuerte carcter hereditario atribuido por los pioneros de la
medida mental a los rasgos aparece suavizado en la definicin de Messick (1989): "Un
rasgo es una caracterstica relativamente estable de una persona
proceso
duradero o
disposicin
un atributo,
que se manifiesta
consistentemente en algn grado a pesar de variaciones considerables en el rango de

contextos y circunstancias" (pg. 15). Por el contrario, la Psicometra funcional
defiende como un principio de partida que ningn rasgo o variable psicolgica
interviniente es relevante. Plantea que dado que es posible definir y medir
directamente los comportamientos a los que supuestamente conducen los rasgos, el
56
papel de estos es redundante.
Rust y Golombok (1989) contrastan la preeminencia de la Psicometra funcional en la

evaluacin educativa, con la de la Psicometra de los rasgos para la evaluacin
clnica; y proponen resolver el enfrentamiento atendiendo a los procesos de toma
de decisin que realizan los clientes de la evaluacin y de la seleccin
psicomtrica: las decisiones se realizan resumiendo la medicin en trminos de
rasgos que reflejan lo que denominan "la psicologa popular humana" ("don de
gentes", "genio", "liderazgo", etc.).
Leccin 9. El mtodo de la Psicometra
Meli (1990) plantea que la conexin entre la Psicometra y la psicologa matemtica,

permite considerar el mtodo de la Psicometra desde una doble vertiente: por un
lado, en tanto que la teora psicomtrica se refiera a contenidos empricos, el
mtodo no es otro que el mtodo cientfico propio de toda ciencia emprica; y por otro
lado, el componente matemtico de los modelos formales de medicin, sujeta a la
teora psicomtrica, como a la psicologa matemtica, a los criterios formales de las
matemticas.
La relacin entre la psicologa matemtica y la Psicometra ha llevado a algunos

autores a defender que el mtodo de la Psicometra es el de la psicologa matemtica.
El esquema elaborado por Jez (1989) es la referencia obligada a la hora de
presentar el mtodo de la psicologa matemtica. De manera resumida, dos son las
caractersticas distintivas del mtodo de la psicologa matemtica: a) la presentacin
formal, generalmente en trminos matemticos, del componente terico; y b) el
recurso a procedimientos deductivos basados en la lgica o a procedimientos de
simulacin a la hora de derivar las consecuencias del modelo matemtico.
57
Mencin especial merece la simulacin, por la preponderancia que est

adquiriendo en Psicometra. El papel metodolgico de la simulacin no resulta fcil de
establecer. Muchos campos de la Psicometra la utilizan como tcnica de obtencin de
datos, cuando el problema de investigacin hace imposible contrastar el modelo con
datos empricos. Este es el caso cuando se pretende descubrir las propiedades y
caractersticas de ndices estadsticos, mtodos de estimacin, potencia de
contrastes, etc. Adems, la simulacin preserva tambin el estatus de mtodo en
cuanto generadora de conocimiento.
El anlisis del mtodo no puede obviar el papel instrumental de la Psicometra

como herramienta metodolgica para la contrastacin emprica de las teoras
psicolgicas. La aplicacin del mtodo cientfico en psicologa obliga a que la
Psicometra desempee un papel activo en diferentes momentos del proceso.
Arnau (1989) articula las relaciones entre el plano terico y emprico del mtodo
cientfico en tres niveles: el nivel terico-conceptual, que abarca desde el
planteamiento del problema hasta la formulacin de hiptesis empricamente
contrastables; el nivel tcnico-metodolgico que abarca el plan de investigacin y la
estrategia de recogida de datos; y el nivel estadstico-analtico, donde se realiza la
modelizacin estadstica de los datos y las inferencias sobre las hiptesis
sometidas a contrastacin. La generalizacin de los resultados hace retornar la
aplicacin del mtodo al nivel terico-conceptual con lo que se cierra el ciclo. La
Psicometra acompaa a la aplicacin del mtodo en cada uno de los tres niveles.
El nivel terico conceptual recoge a teora que contextualiza el problema de

investigacin. La teora debe incluir la definicin operacional y "sintctica" de los
constructos implicados en las hiptesis. A su vez, la teora condiciona la eleccin
del modelo de escalamiento y, por tanto, de las condiciones mtricas que se
exigirn a las mediciones. La red nomolgica desempea adems un papel crucial
58
durante la elaboracin de tests para determinar la utilidad de las puntuaciones

obtenidas.
El nivel tcnico metodolgico implica la construccin o seleccin de los

instrumentos de medida idneos para la medicin de los constructos de inters. La
Psicometra debe guiar el proceso de elaboracin de instrumentos, teniendo en cuenta
la teora psicolgica y el modelo de medida seleccionados en el nivel tericoconceptual.
Dentro del nivel estadstico analtico, las propiedades mtricas de las mediciones
valoradas en el nivel anterior, condicionarn la modelizacin estadstica de los
datos y la elaboracin de proposiciones a partir de los resultados. Por ejemplo, la
informacin sobre la fiabilidad y validez de las mediciones, condicionar la
generalizacin de los resultados en el regreso del proceso de investigacin al nivel
terico conceptual.
Los contenidos de la Psicometra
Hay un consenso amplio en la disciplina sobre cules son los contenidos propios de la
Psicometra. Las diferencias entre las propuestas de los autores responden a las
distintas tradiciones de investigacin de las que procedan o a diferencias en las
estrategias de estudio de una misma temtica. Si se unen las diferentes versiones de
la teora de los tests bajo una denominacin comn, se obtiene la divisin en tres
grandes grupos de los contenidos psicomtricos: teora de la medicin, escalamiento y
teora de los tests. Los dos primeros contenidos han sido o sern objeto de un tema
en el programa de la asignatura. La teora de los tests es introducida en el siguiente
apartado.
Leccin 10. La teora de los tests
La teora de los tests puede verse como un esquema conceptual formalizado para
59
hacer inferencias a partir de las puntuaciones de las personas en los tests y permitir la
toma de decisiones que impliquen el constructo objeto de la medicin. La teora de
los tests proporciona los fundamentos para la elaboracin y uso de los tests,
aportando adems las herramientas para examinar las propiedades mtricas de las
mediciones obtenidas con ellos.
La definicin de test no ha variado de forma significativa conforme evolucionaba la

teora de los tests. Valgan como muestra las definiciones de Anastasi o Lord. Para
Anastasi (1968), un test psicolgico es esencialmente una medida objetiva y tipificada
de una muestra de conducta; para Lord (1980) un test psicolgico o educativo es un
instrumento para obtener una muestra de conducta (pg. 3). La definicin de Yela
(1996) expresa en trminos ms generales la finalidad de los tests como un
reactivo que aplicado a un sujeto revela y da testimonio de la ndole o grado de su
instruccin, aptitud o manera de ser (pg. 249). (definicin de test)
La mayora de los profesionales de la medicin psicolgica coinciden en que las
caractersticas definitorias de un test psicolgico son:
Procedimiento o instrumento estandarizado. Los tests plantean a las personas

evaluadas una serie de tareas previamente determinadas, a las que deben
responder siguiendo unas instrucciones fijadas de antemano y, de forma
habitual, en un contexto controlado.
Obtencin de muestras de conducta. Los tests estn diseados para la

obtencin de los comportamientos reveladores del constructo objeto de la
medicin.
Asignacin numrica. Los tests deben permitir la cuantificacin objetiva de

acuerdo con unas reglas establecidas.
60
Dispone de informacin sobre la calidad de las mediciones. Los autores de los

tests y, en algunas circunstancias, los usuarios deben aportar informacin
tcnica sobre la precisin y relevancia para el objetivo de la evaluacin de las
mediciones aportadas por el test.
Se han elaborado diversas clasificaciones de los tests utilizando diferentes

criterios. Crocker y Algina (1986) ofrecen una clasificacin til de los tests
atendiendo al carcter general de la tarea que deben realizar las personas: tests
de ejecucin ptima, en los que se instruye a la persona para que conteste lo
mejor que pueda (incluira los tests de inteligencia, aptitudes y rendimiento); y tests
de ejecucin tpica, que demandan de la persona informacin sobre sus actitudes,
sentimientos, intereses, etc., donde se incluiran los cuestionarios e inventarios de
personalidad.
Las definiciones de Anastasi y Lord utilizan la expresin muestras de conducta
que sintetiza la finalidad ltima de la teora de los tests. Crocker y Algina (1986)
enumeran los problemas por los que la medida psicolgica est contaminada
por el error:
Ausencia de aproximaciones nicas a la medicin de la mayora de los

constructos. El problema reside bsicamente en las diferencias en las definiciones
operacionales de la mayora de las variables psicolgicas, lo cual suele conducir a
procedimientos diferentes de medida y distintas conclusiones sobre la evaluacin
de una misma persona.
Muestreo limitado del comportamiento. Las mediciones suelen basarse en un

nmero limitado de comportamientos, obtenidos en un muestreo reducido de
situaciones y momentos temporales. As, determinar, por ejemplo, el nmero de
61
tems y la variedad de los contenidos de un test es uno de los problemas

habituales en la elaboracin de los procedimientos de medida.
Presencia inevitable de los errores de medida. Las limitaciones muestrales en la

obtencin de los comportamientos indicadores obligan a estimar el grado de error
presente de forma inevitable en cualquier medicin.
Evolucin de las teoras psicolgicas. Al ser los constructos herramientas

conceptuales para la elaboracin de teoras, el significado de las mediciones
siempre estar sujeto a la evolucin de la teora de la que forma parte,
dependiendo de la obtencin de evidencias que la confirmen o modifiquen.
La finalidad de la teora de los tests es aportar soluciones para minimizar el impacto

de estos problemas sobre la medicin psicolgica (Martnez-Arias, 1995).
La imposibilidad de observar de forma directa la mayora de las variables psicolgicas
obliga a considerar la teora de los tests como una maquinaria conceptual para la
inferencia psicomtrica. En qu consiste la inferencia psicomtrica? La elaboracin
de tems debe reflejar la definicin operacional y sintctica del constructo objeto de la
medicin (Lord y Novick, 1968). El papel de los tems es el de provocar que las
respuestas de las personas en una situacin estandarizada, reflejen la conductas que
en situaciones espontneas, se consideraran los indicadores conductuales del
constructo. La cuantificacin se produce cuando a travs de un procedimiento de
escalamiento se asignan valores cuantitativos a los patrones de repuesta de las
personas en el test. Sobre la inferencia, desde el valor cuantitativo o puntuacin
resumen de la ejecucin de la persona hasta el constructo, pueden incidir diferentes
fuentes de variabilidad no deseada, por no relacionada con el constructo objeto de la
medicin, que pueden amenazar la correccin de la inferencia: fuentes de variabilidad
62
aleatoria, que tradicionalmente se agrupan bajo la denominacin general de

fiabilidad; y fuentes de variacin sistemtica, agrupadas bajo la etiqueta de
validez. El objetivo principal de la teora de los tests es estudiar este proceso de
inferencia y aportar procedimientos para realizarla (Crocker y Algina, 1986). Este
objetivo ha hecho que bajo la denominacin teora de los tests tengan cabida
contenidos tan diversos como: construccin de tests, elaboracin de tems, anlisis de
tems, mtodos de puntuacin e interpretacin de las puntuaciones y, de forma
preponderante, el anlisis de la fiabilidad y validez de las medidas aportadas por los
tests.
La teora de los tests suele dividirse en dos grandes ramas: la teora clsica de los
tests y la teora de respuesta a los tems. La cita de Hambleton y van der Linden
(1982) expresa con toda claridad esta divisin: Las teoras de los tests pueden
dividirse en dos grandes categoras. La primera es la teora clsica de los tests, que
parte de la concepcin de Spearman de la puntuacin observada en el test como
compuesta de un componente verdadero y otro de error... Importantes hitos en esta
larga y venerable tradicin son Theory of mental tests de Gulliksen (1950) y
Statistical theories of mental test scores de Lord y Novick (1968)... La segunda es la
teora de respuesta al tem, o teora del rasgo latente, como se ha llamado hasta hace
poco. Actualmente la teora de respuesta al tem esta teniendo un mayor impacto en el
campo de los tests (pg. 373).
Complemente este apartado con la lectura anexa Los Test
(http://www.psicothema.com/pdf/660.pdf)
63
Captulo 3. Desarrollo de las Pruebas y Metodologa Estadstica de la

Psicometra
Criterios de calidad en la construccin de test
Utilice como gua la siguiente pgina web: http://www.uned.es/psico-3-psicometria/ En

ella encontrar la explicacin de conceptos y tcnicas importantes para la
construccin de pruebas tales como los de Validez y Confiabilidad (fiabilidad), que se
encuentran a continuacin. Adems encontrar ejercicios (plantillas) que podr
resolver.
Leccin 11. Confiabilidad
DEFINICIN:
Criterio de calidad relacionado con la precisin de las medidas obtenidas con un
test y que proporciona informacin acerca de:
la estabilidad temporal de las puntuaciones obtenidas con el test (test-retest y

formas paralelas)
la consistencia interna del test (alpha y dos mitades)
FRMULA GENERAL:
64
PROCEDIMIENTOS EMPRICOS PARA ESTIMAR EL COEFICIENTE DE

FIABILIDAD:
TEST-RETEST:
FORMAS PARALELAS:
BASADOS EN LA DIVISIN DEL TEST EN DOS MITADES:

PARALELAS: Frmula de Spearman-Brown
ESTRICTA O ESENCIALMENTE TAU-EQUIVALENTES:
Frmula de Rulon:
65
Frmula de
Guttman/Flanagan:
BASADOS EN LA COVARIANZA DE LOS ITEMS:
Coeficiente alpha:
KR 20:
KR 21:
FACTORES DE LOS QUE DEPENDE LA FIABILIDAD:

LONGITUD DEL TEST: Frmula de Spearman-Brown
VARIABILIDAD DE LA MUESTRA:
66
Leccin12. Validez
DEFINICIN:
Criterio de calidad relacionado con la adecuacin de las puntuaciones del
test para el objetivo que suscit su aplicacin.
TIPOS DE VALIDEZ:
VALIDEZ DE CONTENIDO:
Trata de garantizar que el test constituye una muestra
adecuada y representativa del contenido que ste
pretende evaluar.
Modo de evaluacin:
Recurso a expertos
VALIDEZ DE CONSTRUCTO:
Trata de garantizar la existencia de un constructo psicolgico que
subyaga y d sentido y significado a las puntuaciones del test.
Modo de evaluacin:
67
Anlisis factorial
Matriz multimtodo-multirrasgo
VALIDEZ PREDICTIVA:
Trata de garantizar la eficacia del test para pronosticar una variable de
inters.
FIABILIDAD:
LONGITUD DEL TEST:
VARIABILIDAD DE LA MUESTRA:
Para el caso de dos variables:
68
FRMULA GENERAL DEL COEFICIENTE DE VALIDEZ:
DERIVADOS DEL COEFICIENTE DE VALIDEZ:
Leccin 13. Conceptos estadsticos, normas y estandarizacin parte i
Por lo general, el resultado inicial de las pruebas es una puntuacin natural como el
nmero total de afirmaciones de personalidad refrendadas en una direccin en
particular o el nmero total de problemas resueltos correctamente, quiz con a
adicin de puntos bonificados por las soluciones rpidas. En la mayor parte de los
casos, esta puntuacin inicial es intil en s misma
para que los resultados de
prueba tengan significado, los examinadores deben ser capaces de convertir la

puntuacin inicial a alguna forma de puntuacin derivada que se base en la
comparacin con un grupo normativo o de estandarizacin. Gran parte de las pruebas
69
se interpreta al comparar los resultados individuales con el desempeo del grupo

normativo; las pruebas referidas a criterio, que se analizan ms adelante, constituyen
una excepcin.
Un grupo normativo consiste en una muestra de personas examinadas que son representativas de la poblacin hacia la cual se dirige la prueba. Considrese una
prueba del conocimiento de vocabulario, diseada para utilizarse con futuros
estudiantes universitarios de primer grado. En este caso, podran recolectarse los
resultados del desempeo de una muestra grande, heterognea y nacional de dichas
personas,
con
propsitos
de
estandarizacin.
El
objetivo
esencial
de
la
estandarizacin de una prueba consiste en determinar la distribucin de las

puntuaciones naturales en un grupo normativo, de modo que quienes desarrollan la
prueba tengan la posibilidad de publicar las puntuaciones derivadas conocidas como
normas. Como se analizar ms adelante, las normas s encuentran en muchas
variedades; por ejemplo, rangos percentiles, equivalentes por edad, equivalentes de
nado o puntuaciones estndar. Las normas indican la posicin que Tiene un individuo
dentro de la prueba, en relacin con el desempeo de otras personas de la misma
edad, grado escolar, sexo y otras variables. Para ser efectivas, las normas deben
obtenerse con gran cuidado y construirse segn los preceptos ya conocidos que se
analizan despus; lo que es ms, pueden volverse anticuadas en slo unos cuantos
aos, de modo que la regla, ms que la excepcin, debe ser el establecimiento
peridico de nuevas normas. El tema de las normas se enfoca de manera indirecta, ya
que el propsito es hacer un anlisis sobre las puntuaciones naturales y despus se
revisan los conceptos estadsticos esenciales para una comprensin de las normas.
Puntuaciones naturales
El nivel ms bsico de informacin proporcionada por una prueba psicolgica es la

puntuacin natural. Por ejemplo, en una prueba de personalidad, con frecuencia la
70
puntuacin natural es el nmero de preguntas respondidas en la direccin codificada

para una escala especfica. En las pruebas de capacidad, por lo comn la puntuacin
natural se integra del nmero de problemas respondidos de manera correcta, al que
con frecuencia se le suman los puntos bonificados por el desempeo rpido. As, el
resultado inicial de la prueba es casi siempre una suma numrica, como 17 de 44
reactivos totales respondidos en la direccin codificada en una escala de depresin, o
29 de 55 puntos de puntuacin natural obtenidos en la subes-cala de Diseo con
Cubos de una prueba de inteligencia.
Sin embargo, debera ser obvio para el lector que las puntuaciones naturales, por s
solas carecen absolutamente de significado. Por ejemplo, de qu sirve conocer que
una persona resolvi de manera correcta 12 de 20 preguntas de razonamiento
abstracto? Qu significado tiene que un examinando haya respondido en la direccin
codificada 19 de 33 preguntas de verdadero-falso de una escala de depresin?
Incluso es difcil pensar sobre dichas preguntas sin recurrir a comparaciones de una
variedad u otra. Se desea saber la manera en que otras personas han respondido a
estas pruebas, si las puntuaciones observadas son altas o bajas en comparacin con
un grupo representativo de sujetos. En el caso de pruebas de capacidad, se tiene
curiosidad de saber si las preguntas fueron fciles o difciles, en especial en relacin
con la edad del sujeto.
De hecho, parece casi trivial que una puntuacin natural adquiera significado principalmente en relacin con las normas, un marco de referencia establecido de manera
independiente que se deriva de una muestra de estandarizacin. Posteriormente .se
ampliar ms acerca de la derivacin y el uso de las normas. Por ahora bastar con
saber que las normas se establecen de modo emprico, a travs de la aplicacin de la
prueba a una nuestra grande y representativa de personas. Despus se compara la
puntuacin del examinado con la distribucin de puntuaciones obtenidas por la
muestra de estandarizacin. As, se determina, a partir de las normas, si una
puntuacin obtenida es baja, promedio o alta La gran parte de las pruebas
71
psicolgicas se interpreta a travs de la consulta de normas; como ya se seal, estos

instrumentos se denominan pruebas referidas a la norma. Sin embargo, se recuerda al
lector que existen otros tipos de instrumentos. En particular, las pruebas referidas a
criterio ayudan a determinar si una persona puede alcanzar un criterio objetivamente
definido, como la suma de pares de nmeros de dos dgitos con una precisin de
97%. En el caso de las pruebas referidas a criterio, las normas no son esenciales. Al
final de este tema se explicarn con ms detalle estas pruebas.
Existen diferentes tipos de normas, pero stas tienen una caracterstica en comn:
cada una incorpora un resumen estadstico de un enorme conjunto de puntuaciones.
As, para comprenderlas, el lector necesita dominar la estadstica descriptiva
elemental. En este punto se hace un modesto parntesis para revisar los conceptos
estadsticos esenciales.
Conceptos estadsticos especiales
Supngase por el momento que se tiene acceso una prueba de vocabulario de alto
nivel, apropiada para examinar las habilidades verbales de profesores universitarios y
otros profesionales (Gregory y Gernert, 1990). La prueba es un cuestionario de opcin
mltiple con 30 palabras difciles como firmamento, paradisiaco y melifluo. Una
profesora toma la prueba y elige la alternativa correcta para 17 de las 30 palabras.
Pregunta cmo se compara su calificacin con otras personas con el mismo nivel
acadmico. Cmo podra responderse a su pregunta?
Una manera de responder a la interrogante consistira en darle una lista de las
puntuaciones naturales de la muestra preliminar de estandarizacin con 100
profesores representativos de su universidad. Sin embargo, incluso con esta muestra
normativa relativamente pequea (lo tpico son miles de individuos), la lista de
puntuaciones de prueba es un despliegue excesivo.
72
Cuando se nos confronta con un conjunto de datos cuantitativos, la tendencia humana

natural es la de resumir, condensar y organizar dichos datos en patrones
significativos. Por ejemplo, en la evaluacin del significado de la puntuacin de
vocabulario de la profesora, el lector podra calcular la puntuacin promedio de toda la
muestra o establecer la posicin relativa de la puntuacin de la profesora.
Distribucin de frecuencias
Una manera simple y til de resumir los datos consiste en tabular una distribucin de
frecuencias , la cual se prepara al especificar un pequeo nmero de intervalos de
clase de igual tamao y despus determinar cuntas puntuaciones caen dentro de
cada intervalo. La suma de las frecuencias de todos los intervalos ser igual a N, el
nmero total de puntuaciones en la muestra. No existe una regla simple para
determinar el tamao de los intervalos; ste, obviamente, depende del nmero de
intervalos deseado. Es comn que la distribucin de frecuencias tenga entre 5 y 15
intervalos de clase. El cuadro indica que un profesor obtuvo una calificacin de 4, 5 o
6; 8 profesores obtuvieron 7, 8 o 9, y as sucesivamente.
Un histograrna proporciona una representacin grfica de la misma informacin contenida en la distribucin de frecuencias. El eje horizontal representa las puntuaciones
agrupadas en intervalos de clase, mientras el eje vertical representa el nmero de
puntuaciones que caen dentro de cada intervalo de clase. En un histograrna, la altura
de una columna indica el nmero de puntuaciones que ocurren dentro de ese
intervalo. Un polgono de frecuencias es similar a un histograrna, excepto que la
frecuencia de los intervalos de clase se representa con puntos en lugar de columnas.
Despus, los puntos independientes se unen por medio de lneas rectas.
73
Distribucin de frecuencia
de las puntuaciones de 100 profesores
en una prueba de vocabulario
Intervalo de clase
4-6
7-9
10-12
13-15
16-18
19-21
22-24
25-27
28-30
Frecuencia
1
8
12
21
24
21
7
5
1
W=100
Medidas de tendencia central
Se puede establecer una sola puntuacin representativa de las 100 puntuaciones de

vocabulario en nuestra muestra? La media (X) o promedio aritmtico es una de dichas
puntuaciones. Se calcula sumando todas las puntuaciones y dividindolas entre N, el
nmero de puntuaciones. Otro ndice til de tendencia central es la mediana, la
puntuacin que se encuentra a la mitad cuando se han ordenado todas las
puntuaciones. Si el nmero de puntuaciones es par, la mediana es el promedio de las
dos puntuaciones a la mitad. En cualquier caso, la mediana es el punto que divide en
dos la distribucin, de modo que la mitad de los casos se encuentren por encima de
ella y la mitad por debajo. Por ltimo, la moda es simplemente la puntuacin que
ocurre con mayor frecuencia. Si dos puntuaciones tienen la mayor frecuencia de
ocurrencia, se dice que la distribucin es bimodal. La media es sensible a los valores
extremos y puede ser engaosa si una distribucin tiene pocas puntuaciones
inusualmente altas o bajas. Considrese el caso extremo donde nueve personas
ganan $10 000.00 y una dcima persona gana $910 000.00. El ingreso promedio para
este grupo de personas sera de $100 000; sin embargo, este nivel de ingresos no es
tpico de nadie dentro del grupo. La mediana del ingreso, colocada en $10 000, es
74
mucho ms representativa. Por supuesto, ste es un ejemplo extremo, pero ilustra un

punto en general: si una distribucin est sesgada (es decir, es asimtrica), la
mediana es un mejor ndice de la tendencia central que la meda.
-
Medidas de variabilidad
Dos o ms distribuciones de puntuaciones de prueba pueden tener la misma media y,

sin embargo, es posible que difieran en gran medida en el grado de dispersin de las
puntuaciones con respecto a la media. Para describir el grado de dispersin, es
necesario un ndice estadstico que exprese la variabilidad de las puntuaciones en una
distribucin.
El ndice estadstico de variabilidad que se utiliza con mayor frecuencia en un grupo
de puntuaciones es la desviacin estndar, simbolizada o/y abreviada DE. Desde un
punto de vista conceptual, el lector necesita saber que la DE refleja el grado de
dispersin en un grupo de puntuaciones. Si stas se encuentran agrupadas
estrechamente cerca de un valor central, la Ol es pequea. De hecho, en el caso
extremo donde todas las puntuaciones son idnticas, la DE es exactamente cero. A
medida que un grupo de puntuaciones se dispersa ms, la DE se vuelve ms grande.
Como lo sugiere el nombre, la varianza es una medida de variabilidad. Sin embargo,
en general, los psiclogos prefieren informar la desviacin estndar, que se calcula
obteniendo la raz cuadrada de la varianza. Por supuesto, la varianza y la desviacin
estndar transmiten informacin intercambiable una se puede calcular a partir de la
otra, al elevar al cuadrado (la desviacin estndar para obtener la varianza) u obtener
la raz cuadrada (de la varianza para obtener la desviacin estndar). Sin embargo, la
desviacin estndar es la medida preferida de varianza en las pruebas psicolgicas,
debido a su relevancia directo para la distribucin normal.
-
Distribucin normal
Los psiclogos prefieren una distribucin normal de puntuaciones de prueba, aun

cuando muchas otras distribuciones son tericamente posibles. Por ejemplo, dentro de
75
la esfera de posibilidades se encuentra la distribucin rectangular de puntuaciones de

prueba -un nmero igual de resultados en cada intervalo de clase. De hecho, muchos
legos podran incluso preferir una distribucin rectangular de puntuaciones de prueba,
basados en la premisa equitativa de que las diferencias individuales seran por ello
menos pronunciadas. Por ejemplo, una mayor proporcin de personas obtendra
puntuaciones en el rango superior si las pruebas psicolgicas se conformaran a una
distribucin rectangular de puntuaciones, en vez de a una distribucin normal.
Entonces, por qu los psiclogos prefieren una distribucin normal de puntuaciones,

aun hasta el punto de seleccionar reactivos de prueba que ayuden a producir este tipo
de distribucin en la muestra de estandarizacin? Existen varias razones para ello,
incluyendo las consideraciones estadsticas y los dalos empricos. Aqu se har un
breve parntesis para explicar la fascinacin psicomtrica con las distribuciones
normales.
Una razn por la que los psiclogos prefieren las distribuciones normales es que la
curva normal tiene caractersticas matemticas tiles que forman la base para varios
tipos de investigacin estadstica. Supngase que se tiene inters en determinar si los
CI promedio de dos grupos de personas fueron significativamente diferentes. Sera
apropiado utilizar una estadstica inferencial como la prueba / para la diferencia entre
medias. Sin embargo, muchas estadsticas inferenciales se basan en la suposicin de
que la poblacin subyacente de puntuaciones se distribuye de manera normal, o muy
cercano a ello. As, a fin de facilitar el uso de estadsticas inferenciales, los psiclogos
prefieren que las puntuaciones de prueba en la poblacin normal sigan una
76
distribucin normal o casi normal.

Otra base para preferir la distribucin normal es su precisin matemtica. Dado que la
distribucin normal se define de manera precisa en trminos matemticos, es posible
calcular con gran exactitud el rea bajo las diferentes regiones de la curva. As, una
propiedad til de las distribuciones normales es que el porcentaje de casos que caen
dentro de un cierto rango o ms all de un cierto valor se conoce de manera exacta.
Una tercera base para preferir una distribucin normal de las puntuaciones de prueba
es que, con frecuencia, la curva normal surge de manera espontnea en la naturaleza.
-
Transformacin de las puntuaciones naturales
Darle sentido a los resultados de prueba es, en gran medida, una cuestin de
transformar las puntuaciones naturales en formas ms interpretables y tiles de
informacin. En el anlisis anterior acerca de las distribuciones normales, se
insinuaron las transformaciones al mostrar la manera en que el conocimiento sobre la
media y la desviacin estndar de dichas distribuciones pueden ayudar a determinar
la posicin relativa de una puntuacin individual. En esta seccin se continuar con
este tema de una manera ms directa, al presentar los requisitos formales para varios
tipos de transformaciones de las puntuaciones naturales
Percentiles y rangos percentiles
Un percentil expresa el porcentaje de personas dentro de la muestra de
estandarizacin que obtuvieron puntuaciones por debajo de una puntuacin natural
especfica.
Se advierte al lector que no debe confundir los percentiles con el porcentaje de
respuestas correctas. Recurdese que un percentil indica slo cmo se compara a un
individuo con la muestra de estandarizacin y no transmite el porcentaje de preguntas
respondidas de manera correcta. Es posible que, en una prueba difcil, una puntuacin
natural de 50% de respuestas correctas pudiera traducirse a un percentil 90, 95 o
incluso 100. A la inversa, en una prueba fcil, una puntuacin natural de 95% de
respuestas correctas podra traducirse a un percentil 5, 10o 20.
77
Los percentiles tambin pueden concebirse como ltigos en un grupo de 100 sujetos
representativos, donde I es el rango inferior y 100 el superior. Obsrvese que los
rangos percentiles son el reverso completo de los procedimientos comunes de
clasificacin por rangos. Un rango percentil (RP) de I se encuentra en el extremo
inferior de la muestra, mientras que un RP de 99 se encuentra cerca del tope.
Puntuacin estndar
Aunque los percentiles son el tipo ms popular de puntuacin transformada, las
puntuaciones estndar ejemplifican las propiedades psicomtricas ms deseables.
Una puntuacin estndar utiliza la desviacin estndar de la distribucin total de
puntuaciones naturales como la unidad fundamental de medida. La puntuacin estndar expresa la distancia de la media en unidades de desviacin estndar. Por ejemplo,
una puntuacin natural que se encuentra exactamente a una desviacin estndar por
encima de la media se convierte en una puntuacin estndar de +1.00. Una
puntuacin natural que se encuentra exactamente a la mitad de una desviacin
estndar por debajo de la media, se convierte en una puntuacin estndar de -0.50.
As, una puntuacin estndar no slo expresa la magnitud de la desviacin con
respecto a la media, sino tambin la direccin de esa desviacin (positiva o negativa).
El clculo de la puntuacin estndar de un individuo (tambin llamada puntuacin z)
es sencillo: se resta la puntuacin natural de la persona examinada a la media del
grupo normativo y despus se divide esta diferencia entre la desviacin estndar del
grupo normativo.
La puntuacin estndar posee la propiedad psicomtrica deseable de conservar las
magnitudes relativas de distancia entre los valores sucesivos, encontradas entre las
puntuaciones naturales originales. Esto se debe a que la distribucin de las
puntuaciones estndar tiene la misma forma que la distribucin de las puntuaciones
naturales. Como consecuencia, el uso de las puntuaciones estndar no distorsiona la
escala de medida subyacente.
78
Puntuaciones T y otras puntuaciones estandarizadas
Muchos psiclogos y educadores aprecian las propiedades psicomtricas de las

puntuaciones estndar, pero consideran las fracciones decimales y los signos
positivos y negativos (p. ej., z = -2.32) como distracciones innecesarias. En respuesta
a estas preocupaciones, los especialistas en pruebas han diseado cierto nmero de
variaciones para las puntuaciones estndar que colectivamente se conocen como
puntuaciones estandarizadas.
Desde un punto de vista conceptual, las puntuaciones estandarizadas son idnticas a
las puntuaciones estndar. Ambas contienen exactamente la misma informacin. No
se afecta la forma de la distribucin de puntuaciones y la relacin entre las
puntuaciones estndar y estandarizadas siempre se traza como una lnea recta. Sin
embargo, las puntuaciones estandarizadas siempre se expresan como nmeros
enteros positivos (no existen fracciones decimales ni signos negativos), de modo que
muchos usuarios de prueba prefieren representar los resultados en esta forma.
Las puntuaciones estandarizadas eliminan las fracciones y los signos negativos al
producir valores diferentes a cero para la media y 1.00 para la desviacin estndar de
las puntuaciones transformadas. La media de las puntuaciones transformadas puede
establecerse en cualquier valor conveniente como 100 o 500 y la desviacin estndar
en, digamos, 15 o 100. El punto importante acerca de las puntuaciones estandarizadas es que se puede transformar cualquier distribucin a una escala preferida
con media y desviacin estndar predeterminadas.
Un tipo muy conocido de puntuacin estandarizada es la puntuacin T, que tiene una
media de 50 y desviacin estndar de 10. Las escalas en puntuacin T son
especialmente comunes en las pruebas de personalidad. Por ejemplo, en el MMP1,
cada escala clnica (como Depresin, Paranoia) se convierte a una medida comn,
donde 50 es la puntuacin promedio y 10 es la desviacin estndar de la muestra
79
normativa.
Las puntuaciones estandarizadas se pueden adaptar para producir cualquier media y
desviacin estndar. Sin embargo, para eliminar las puntuaciones estandarizadas
negativas, la media preseleccionada debe ser cuanto menos 5 veces tan grande como
la DE. En la prctica, quienes desarrollan pruebas dependen de unos cuantos valores
preferidos para
las
medias
y desviaciones
estndar
de
las
puntuaciones
estandarizadas.
Leccin 14. Conceptos estadsticos, normas y estandarizacin parte ii
Seleccin de un grupo normativo
Cuando se elige un grupo normativo, quienes desarrollan pruebas se esfuerzan por

obtener una muestra representativa de la poblacin para la cual se dise la prueba
(Petersen, Kolen y Hoover, 1989). En teora, obtener un grupo normativo
representativo es simple y sencillo. Considrese una prueba de rendimiento escolar
diseada para nios de sexto grado de primaria en EUA. La poblacin relacionada la
constituyen todos los nios en sexto grado, de costa a costa del pas y en Alaska y
Hawai. Se puede obtener una muestra representativa de estos individuos potenciales
a travs de un muestreo aleatorio por computadora de aproximadamente 10 000
nios, entre los millones de nios elegibles. Cada uno tendra igual probabilidad de ser
elegido para realizar la prueba; es decir, la estrategia de seleccin sera un simple
muestreo aleatorio. Los resultados de dicho muestreo constituiran una fuente ideal
para los datos normativos. Con una muestra aleatoria amplia, es casi seguro que la
diversidad de antecedentes tnicos, clases sociales, localizaciones geogrficas y
entornos urbanos contra rurales tendran una representacin proporcional en la
muestra.
80
En el mundo real, obtener muestras normativas nunca es tan sencillo y definitivo como
el caso hipottico anterior. Los investigadores no tienen una lista completa de todos
los nios de sexto grado en el pas y, aunque la tuvieran, quienes desarrollan pruebas
no podran obligar a lodos los nios seleccionados al azar a que participaran en la
estandarizacin de una prueba. Tambin surgen asuntos relacionados con el costo.
Debe pagarse a los psicmetras para que apliquen la prueba al grupo normativo. Los
autores de la prueba pueden optar por unos cuantos cientos de personas
representativas en vez de utilizar un nmero mayor.
Para ayudar a asegurar que los grupos normativos de menor tamao sean
verdaderamente representativos de la poblacin para la cual se dise la prueba, los
autores de la misma utilizan un muestreo aleatorio estratificado. Este enfoque consiste
en estratificar, o clasificar, a la poblacin blanco en cuanto a variables antecedentes
(como edad, sexo, raza, clase social, nivel educativo) y despus seleccionar al azar un
porcentaje apropiado de personas dentro de cada estrato. Por ejemplo, si 12% de la
poblacin relacionada es afroestadounidense, entonces quien desarrolla la prueba
elige los sujetos de manera aleatoria, pero con la restriccin de que 12% del grupo
normativo debe ser tambin afroestadounidense.
En la prctica, muy pocos creadores de pruebas reproducen completamente el
muestreo aleatorio o el muestreo aleatorio estratificado en el proceso de seleccin del
grupo normativo. Lo que es ms tpico es un esfuerzo de buena fe por elegir una
muestra diversa y representativa de escuelas fuertes y dbiles; vecindarios
minoritarios y blancos; ciudades grandes y pequeas y comunidades del norte, este,
centro y sur. Si esta muestra engloba entonces aproximadamente el mismo porcentaje
de minoras, habitantes de las ciudades, familias de clase alta y baja que el censo
nacional, entonces los autores de la prueba se sienten seguros de que el grupo es
representativo.
Existe una importante leccin en las incertidumbres, concesiones y aspectos prcticos
de la seleccin del grupo normativo; a saber, que las normas de pruebas psicolgicas
81
no son absolutas, universales o intemporales. Son relativas a una poca histrica y a

la poblacin normativa particular de la cual se derivaron. Se ilustrar la naturaleza
efmera de las estadsticas normativas en una seccin posterior cuando se muestre
cmo una importante prueba de CI en cuyas normas se estableci un promedio
nacional de 100 puntos en 1974, produjo un promedio nacional de 107 en 1988.
Incluso las normas que se seleccionan con gran cuidado y se basan en muestras
grandes pueden volverse obsoletas en el curso de un decenio y en ocasiones
menos.
Normas por edad y grado escolar
A medida que uno crece, se cambia de manera calculable, ya sea para mejorar o
empeorar. Esto es obviamente cierto en la infancia, cuando las habilidades
intelectuales mejoran visiblemente de un mes a otro. En la edad adulta, el cambio
personal es lento, pero aun se puede discernir. Por ejemplo, se espera que los adultos
muestren un nivel ms maduro de vocabulario con cada decenio que transcurre
(Gregory y Gernert, 1990). Una norma por edad representa el nivel de desempeo en
la prueba para cada grupo independiente segn la edad dentro de la muestra
normativa. El propsito de las normas por edad es el de facilitar las comparaciones
entre individuos de la misma edad. Con las normas por edad, el desempeo de una
persona se interpreta en relacin con los sujetos dentro de la estandarizacin que
tienen la misma edad. El rango de edades para un grupo normativo por edad puede
variar de un mes a un decenio o ms, segn el grado en que el desempeo en la
prueba depende de los aos de vida. Para caractersticas que cambian con rapidez
como las capacidades intelectuales durante la infancia los creadores de pruebas
podran informar normas independientes de prueba para grupos de edad definidos de
manera estrecha; por ejemplo, intervalos de cuatro meses. Eso permite que, por decir,
el examinador compare los resultados de prueba de un nio que tiene cinco aos, dos
meses de edad (edad 5-2) con la muestra normativa de nios que van de los 5-0 a los
82
5-4 aos. En contraste, las caractersticas adultas cambian de manera ms lenta y

podra ser suficiente con informar datos normativos para intervalos de edad de 5 o 10
aos.
Las normas segn el grado escolar son conceptualmente similares a las normas por
edad. Una norma por grado representa el nivel de desempeo en pruebas para cada
grado escolar dentro de la muestra normativa. Las normas por grado se utilizan poco
en el caso de pruebas de capacidad. Sin embargo, stas son especialmente tiles en
entornos educativos, cuando se presentan los niveles de rendimiento de los nios en
edad escolar. Dado que el rendimiento acadmico en muchas reas de contenido
depende en gran medida de la exposicin al currculo de materias segn el grado
escolar, la comparacin de un estudiante contra una muestra normativa del mismo
grado es ms apropiada que emplear comparaciones basadas en la edad.
Pruebas referidas a criterio
Una alternativa a las pruebas referidas a la norma, es las pruebas referidas a criterio
(Frechtling, 1989; Glaser, 1963; Popham, 1978; Berk, 1984). Mientras que las
primeras utilizan una muestra representativa de personas como su marco de
referencia interpretativo, una prueba referida a criterio compara los logros de un
individuo examinado con un rea bien definida de contenido. Por ejemplo, el
desempeo de la persona que se somete a prueba podra presentarse como un nivel
especfico de habilidad en aritmtica (suma correctamente 2 nmeros de 3 dgitos en
100% de las ocasiones, pero slo tiene 70% de precisin cuando suma 3 nmeros de
3 dgitos).
Las pruebas referidas a criterio representan un cambio fundamental en perspectiva. El
centro de atencin se coloca en aquello que el examinado puede hacer, ms que en
comparaciones con los niveles de desempeo de otros individuos. As, las pruebas
referidas a criterio identifican el dominio (o falta de dominio) absoluto de la persona
83
examinada en relacin con conductas especficas. En general, estas pruebas se han

utilizado en entornos escolares para ayudar a los maestros dentro del saln de clase a
determinar qu se debe ensear y tambin para evaluar los efectos precisos de los
esfuerzos de enseanza del currculo escolar.
Las pruebas referidas a criterio son ms adecuadas para examinar las habilidades
acadmicas bsicas (p. ej., nivel de lectura, habilidades de clculo aritmtico) en
ambientes educativos. Sin embargo, estos tipos de instrumentos son sumamente
inapropiados para examinar capacidades de nivel superior, debido a que es difcil
formular objetivos especficos para dichas reas de contenido. Considrese un caso
en particular: cmo se desarrollara una prueba referida a criterio para examinar la
pericia en programacin de computadora? Sera difcil proponer conductas especficas
que pudieran poseer todos los expertos en programacin de computadoras y, por
tanto, sera casi imposible construir una prueba referida a criterio para esta habilidad
de alto nivel. Berk (1984) analiza los problemas tcnicos en la construccin y
evaluacin de este tipo de pruebas.
Leccin 15. Construccin de pruebas
Un autor de pruebas debe elegir estrategias y materiales y despus tomar decisiones

continuas de investigacin que afectarn la calidad de su instrumento en germinacin.
El propsito de esta seccin consiste en analizar el proceso mediante el cual los
psicmetras creen pruebas vlidas. Aunque se examinarn muchas cuestiones independientes, a todas las vincula un tema en comn: las pruebas vlidas simplemente
no aparecen en escena en plena madurez surgen de manera lenta de un proceso
evolutivo. En este tema se enfatizarn los aspectos bsicos del desarrollo de pruebas.
-
La construccin de pruebas consta de seis etapas entrelazadas:
Definicin de la prueba.
Seleccin de un mtodo de escalamiento.
84
Construccin de los reactivos.
Examen de los reactivos.
Revisin de la prueba.
Publicacin de la prueba.
La definicin de la prueba consiste en la delimitacin de su alcance y propsito, los

cuales deben conocerse antes de que el autor pueda proseguir con su construccin.
La seleccin de un mtodo de escalamiento es un proceso en el que se establecen las
reglas mediante las cuales se asignan nmeros a los resultados de la prueba. La
construccin de los reactivos es tanto un arte como una ciencia y es aqu donde
puede
requerirse la creatividad del autor. Una vez que
se tiene disponible una
versin preliminar de la prueba, los autores en general la aplican a una muestra de

tamao modesto de individuos, a fin de reunir los datos inciales sobre las caractersticas de los reactivos. El examen de stos implica una variedad de procedimientos
estadsticos conocidos como anlisis de reactivos, cuyo propsito consiste en
determinar cules reactivos deben conservarse, revisarse y eliminarse. Con base en
el anlisis de reactivos y en otras fuentes de informacin, se revisa la prueba. Si las
revisiones son sustanciales, es posible que se requieran nuevos reactivos y
prepruebas adicionales con nuevos individuos. As, la construccin de pruebas implica
un circuito de realimentacin donde se podran producir 2, 3 y 4 bosquejos de un
instrumento. La publicacin de la prueba es el paso final. Adems de difundir los
materiales de una prueba, el autor debe producir un manual fcil de comprender para
el usuario. A continuacin se examinarn con ms detalle cada uno de estos pasos.
Definicin de la prueba
A fin de construir una nueva prueba, el autor debe tener una idea clara de aquello que
ha de medir y de cmo difiere sta de los instrumentos existentes. Dado que la
existencia de las pruebas psicolgicas est a punto de entrar en su segundo siglo y ya
85
que se han publicado miles de pruebas para este momento, es claro que la
responsabilidad de probar que un instrument es diferente y mejor que los existentes
depende del autor.
Considrese la sobrecogedora tarea que enfrenta un autor de pruebas que propone
otro instrumento de inteligencia general. Con docenas de dichos instrumentos en
existencia, cmo es posible que uno nuevo haga una contribucin til al campo? La
respuesta es que la investigacin contempornea aumenta de manera continua la
comprensin acerca de la inteligencia e impulsa a buscar nuevas maneras y ms
tiles de medir este constructo multifactico.
Seleccin de un mtodo de escalamiento
El propsito inmediato del examen psicolgico es asignar nmeros a las respuestas
en una prueba de modo que pueda juzgarse que la persona examinada tiene una
mayor o menor cantidad de la caracterstica medida. Las reglas mediante las cuales
se asignan nmeros a las respuestas definen el mtodo de escalamiento. Los autores
de pruebas seleccionan un mtodo de este tipo que se adecu en forma ptima a la
manera en que han conceptuado el rasgo o rasgos medidos por su prueba. Ningn
mtodo de escalamiento es uniformemente mejor que otros. En el caso de algunos
rasgos, la clasificacin ordinal de parte de jueces expertos podra ser el mejor enfoque
de medicin; en el caso de otros, la medicin escalar compleja de los datos de
autoinforme puede producir las medidas ms vlidas.
No obstante, antes de revisar los mtodos de escalamiento seleccionados, es
necesario que se presente un concepto relacionado, los niveles de medicin.
Niveles de medicin
Todos los nmeros extrados de los instrumentos de medicin de cualquier tipo

pueden colocarse dentro de una de cuatro categoras jerrquicas: nominal, ordinal, de
intervalo o de razn. Cada categora define un nivel de medicin; el orden que se lista
86
es de menos a ms informativo.
En las escalas nominales, los nmeros sirven slo como nombres de categoras. Por
ejemplo, cuando se obtienen datos para un estudio demogrfico, un investigador
podra codificar a los varones como "1" y a las mujeres como "2". Vase que los
nmeros son arbitrarios y no designan si hay "ms" o "menos" de una cosa. En las
escalas nominales, los nmeros son slo una forma simplificada de denominacin.
Las escalas ordinales constituyen una forma de ordenacin o clasificacin. Si se les
pidiera a profesores universitarios que clasificaran cuatro automviles en cuanto a cul
preferiran poseer, el orden preterido podra ser "1" Cadillac, "2" Chevrolet, "3"
Volkswagen, "4" Hyundai. Obsrvese en este caso que los nmeros no son
intercambiables. Una clasificacin de "1" es "ms" que una clasificacin de "2" y as
sucesivamente. El "ms" se refiere al orden de preferencia. Sin embargo, las escalas
ordinales no proporcionan informacin sobre la fortaleza relativa de las clasificaciones.
En este ejemplo hipottico no se puede saber si los profesores universitarios tienen
una fuerte preferencia por los Cadillac por encima de los Chevrolet o slo hay una
diferencia marginal en su preferencia.
Una escala de intervalo proporciona informacin acerca de clasificacin, pero tambin
provee una medida para estimar las diferencias entre clasificaciones, para construir
una escala de intervalo se podra pedir a los profesores universitarios que calificaran
en una escala de I a 100 qu tanto les gustara poseer los cuatro automviles antes
citados. Supngase que las calificaciones promedio van como sigue: Cadillac, 90;
Chevrolet, 70; Volkswagen, 60; Hyundai, 50. A partir de esta informacin se puede
inferir que la preferencia por un Cadillac es mucho ms fuerte que por un Chevrolet
que, a su vez, tiene una preferencia levemente ms fuerte que el Volkswagen. Ms
importante an es que tambin puede suponerse que los intervalos entre los puntos
en esta escala son aproximadamente iguales: La diferencia ende la preferencia de los
profesores por un Chevrolet y un Volkswagen (10 puntos) es ms o menos la misma
que existe entre un Volkswagen y un Hyundai (tambin 10 puntos). En pocas pala-
87
bras, las escalas de intervalo se basan en la suposicin de unidades o intervalos de

igual tamao para la escala subyacente.
Una escala de razn tiene todas las caractersticas de una escala de intervalo, pero
tambin posee un punto cero conceptualmente significativo, en el que existe ausencia
total de la caracterstica medida.
Las escalas de razn son poco comunes en la medicin psicolgica. Considrese si
existe algn sentido significativo en el que pueda pensarse que una persona tiene
cero inteligencia. No, en realidad. Lo mismo ocurre con la mayor parle de los
constructos en psicologa, los puntos cero significativos simplemente no existen. Sin
embargo, unas cuantas medidas fsicas que emplean los psiclogos califican para
escalas de razn. Por ejemplo, la estatura y el peso alcanzan esa calificacin y quiz
tambin algunas medidas fisiolgicas.
Los niveles de medicin son relevantes para la construccin de pruebas debido a que
los procedimientos estadsticos paramtricos ms poderosos y tiles (p. ej., rae
Pearson, anlisis de varianza, regresin mltiple) deberan utilizarse slo para
puntuaciones obtenidas de medidas que satisfacen los criterios de las escalas de
intervalo o de razn. Para las escalas que slo son nominales u ordinales deben
emplearse procedimientos estadsticos no paramtricos menos poderosos (p. ej., ji
cuadrada, correlacin por rangos, pruebas de mediana).
Mtodos representativos
Clasificaciones de expertos
Supngase que se desea medir la profundidad del coma en los pacientes que han
sufrido un traumatismo craneal reciente que los ha dejado inconscientes. Una escala
de profundidad del coma sera muy importante para la prediccin del curso de la
mejora, debido a que es bien conocido que un periodo extenso de inconsciencia
88
ofrece un pronstico pobre de recuperacin. Adems, el personal de rehabilitacin

tiene la necesidad prctica de saber si un paciente est en coma profundo o se
encuentra en un estado parcialmente comunicativo de conciencia con somnolencia.
Un enfoque de la medicin con una escala de la profundidad del coma consistira en
depender de las clasificaciones de expertos en cuanto a aspectos conductuales. Por
ejemplo, se le puede pedir a un panel de neurlogos que enumere las conductas
asociadas con los diferentes niveles de conciencia. Despus de que stos han
presentado una gran lisia de conductas diagnsticas, los autores de la prueba preferiblemente expertos en traumatismos craneales clasificaran las conductas
indicadoras en un continuo de conciencia que vaya desde el coma profundo hasta la
orientacin bsica. Teasdale y Jennett (1974) utilizaron justo este enfoque y
produjeron la Glasgow Coma Scale (Escala de Coma de Glasgow). Instrumentos
similares a ste se emplean de manera amplia en hospitales para la evaluacin de
lesiones por traumatismo craneal.
La Glasgow Coma Scale se califica al observar al paciente y asignar el mximo nivel
de funcionamiento en cada una de las tres subes-calas. En cada una se supone que el
paciente presenta todos los niveles de conducta por debajo del nivel calificado. As,
desde un punto de vista psicomtrico, esta escala consiste de tres subescalas (ojos,
respuesta verbal y respuesta motora) cada una de las cuales produce una
clasificacin ordinal de conducta.
Si se asignan nmeros a las clasificaciones (p. ej., para ojos abiertos una codificacin
de "no" = 1; "ante el dolor" = 2 y as sucesivamente), entonces pueden sumarse los
nmeros para el nivel calificado en cada subescala, lo cual produce una puntuacin
mxima posible de 14 puntos. La puntuacin total en la Glasgow Coma Scale predice
la recuperacin posterior con un grado muy alto de precisin.
-
Mtodo de intervalos de aparicin balanceada
A principios de este siglo, L. L. Thurstone (1929) propuso un mtodo para construir

escalas al nivel de intervalo a partir de afirmaciones de actitud. Su mtodo de
89
intervalos de aparicin balanceada todava se utiliza en la actualidad, lo cual hace que

Thurstone sea uno de los gigantes de la teora psicomtrica. La metodologa en s
para construir intervalos de aparicin balanceada es un tanto estadsticamente
compleja y abrumadora, pero la lgica subyacente es fcil de explicar (Ghiselli,
Campbell y Zedeck, 1981). Para ilustrar este mtodo, se resumen los pasos
implicados en la construccin de una escala de actitudes hacia la membreca a una
iglesia.
1. Se obtienen tantas afirmaciones posibles de falso-verdadero que reflejen una
variedad de actitudes positivas y negativas hacia la iglesia. Dos ejemplos extremos
podran ser: "Siento que los servicios religiosos me dan inspiracin y me ayudan a dar
lo mejor de m mismo durante la siguiente semana". "Pienso que las iglesias buscan
imponer gran cantidad de dogmas anticuados y supersticiones medievales". Por
supuesto, tambin se reuniran muchos reactivos moderados.
2. A continuacin, se le pide a un nmero aproximado de 10 jueces expertos que
califiquen
estas
afirmaciones
para
determinar
el
grado
de
favorabilidad/desfavorabilidad hacia la actitud. Los jueces deben ser calificados para

esa tarea; podra utilizarse a ministros para una escala de actitud hacia la membreca
a una iglesia. En general, se pide a cada juez que clasifique cada afirmacin en
categoras de 1 a 11 que vayan desde "extremadamente favorable" hasta
"extremadamente desfavorable. Se le dice a los jueces que hagan a un lado sus
propios prejuicios y que consideren las 11 categoras como equidistantes.
3. Despus de que los jueces han terminado con el proceso de evaluacin, se
determina la calificacin media de favorabilidad (de 1 a 11) y la desviacin estndar
para cada reactivo. Por ejemplo, 10 jueces pueden haber dado una calificacin
promedio de favorabilidad de 9.2 al primer reactivo antes enunciado; pero es probable
que las calificaciones difieran de un juez a otro, como se refleja en una desviacin
estndar de 1.1 para este reactivo.
4. Debido a que la desviacin estndar en la calificacin de favorabilidad de un
90
reactivo refleja ambigedad, los reactivos con desviaciones estndar grandes se

descartan. Por lo general, se eligen aproximadamente 20 a 30 reactivos, de modo que
las afirmaciones cubran el rango de la dimensin (favorable a desfavorable). Se
supone que las diferencias entre reactivos en la escala final satisfacen las
propiedades de una escala de intervalo.
5. Se pide a las personas que contesten la escala de actitud que marquen todas las
afirmaciones con las que concuerdan. Su calificacin se determina al promediar los
valores de escala de los reactivos respaldados.
- Mtodo de escalamiento absoluto
Thurstone (1925) tambin desarroll el mtodo de escalamiento absoluto, un

procedimiento para obtener una medida de la dificultad absoluta de los reactivos con
base en los resultados de diferentes grupos de personas examinadas de diferentes
edades. La metodologa para determinar la dificultad individual de los reactivos en un
escalamiento absoluto es bastante compleja, aunque la fundamentacin subyacente
no es tan difcil de comprender. En esencia, se aplica un conjunto de reactivos
comunes de prueba a dos o ms grupos de diferentes edades. La dificultad relativa de
stos sirve como fundamento para realizar una serie de comparaciones entrelazadas
para todos los reactivos y todos los grupos por edad. Un grupo por edad sirve como
grupo base. La dificultad de los reactivos se mide en unidades comunes como
unidades de capacidad en desviacin estndar para el grupo base. El mtodo de
escalamiento absoluto se utiliza ampliamente en pruebas de rendimiento y aptitud
(STEP, 1980; Donlon, 1984).
Thurstone (1925) ilustr el mtodo de escalamiento absoluto con datos de prueba de 3
000 escolares en las 65 preguntas de la prueba Binet original. Con la media de
inteligencia de los nios de 3 aos, 6 meses de edad en la prueba Binet como punto
cero y la desviacin estndar de su inteligencia como unidad de medicin, construy
91
una escala que iba de -2 a + 10 y despus localiz cada una de las 65 preguntas en
esa escala. Thurstone (1925) encontr que la escala "hace surgir de manera bastante
sorprendente el hecho de que las preguntas se encuentran agrupadas de manera
indebida en ciertos rangos de dificultad y son ms bien escasas en otros". Un autor
moderno de pruebas utilizara este tipo de anlisis como base para eliminar reactivos
redundantes (en el sentido de que miden el mismo nivel de dificultad) y aadira otros
que analicen los rangos superiores (e inferiores) de dificultad.
-
Escalas Likert
Likert (1932) propuso un mtodo sencillo y directo para asignar una escala a las
actitudes, el cual tiene amplia utilizacin hoy da. Una escala Likert le presenta a la
persona evaluada cinco respuestas ordenadas en un continuo de acuerdo/desacuerdo
o aprobacin/desaprobacin. Por ejemplo, un reactivo en una escala para evaluar las
actitudes hacia la membreca a una iglesia podra ser:
Los servicios religiosos me dan inspiracin y me ayudan a dar lo mejor de m mismo
durante la siguiente semana.
Dependiendo del fraseo de un reactivo en particular, una respuesta extrema de

"fuertemente de acuerdo" o "fuertemente en desacuerdo" indicara la respuesta ms
favorable en la actitud subyacente medida con este cuestionario. Likert (1932) asign
una puntuacin de 5 a esta respuesta extrema, 1 a las respuestas totalmente contraria
y 2, 3 y 4 a las respuestas intermedias. La puntuacin total de la escala se obtiene al
sumar las puntuaciones de los reactivos individuales. Por tal razn, la escala Likert
tambin se conoce como escala sumatoria.
-
Escalas Guttman
En una escala Gutiman, las personas que corroboran una afirmacin tambin
concuerdan con afirmaciones ms leves que tienen que ver con el mismo continuo
subyacente (Guttman, 1944, 1947). As, cuando el examinador conoce la confirmacin
ms extrema de la persona evaluada en el continuo, le es posible reconstruir tambin
92
la respuesta intermedia. Las escalas Guttman se producen al seleccionar reactivos

que caigan en una secuencia ordenada de confirmaciones de la persona examinada.
Es poco comn que se logre una escala Guttman perfecta debido a los errores de
medicin pero, de todas maneras, es una meta adecuada para ciertos tipos de
pruebas.
Aunque el enfoque Guttman se dise originalmente para determinar si un conjunto de
afirmaciones de actitud es unidimensional, la tcnica se ha utilizado para muchos tipos
diferentes de pruebas. Por ejemplo, Beck utiliz un mtodo de escalamiento del tipo
Guttman para producir los reactivos individuales del Beck Depression Inventory
(Inventario Beck de Depresin; BDI, Beck, Steer y Garbn, 1988; Beck y
colaboradores, 1961). Los reactivos de este inventario se parecen a los siguientes:
( ) En ocasiones me siento triste o afligido
( ) Con frecuencia me siento triste o afligido
( ) Me siento triste o afligido la mayor parte del tiempo
( ) Siempre me siento triste y no puedo tolerarlo.
Se pide al cliente que "marque en cada grupo las afirmaciones que, a su parecer, lo
representen de manera ms certera". Un cliente que marque una alternativa extrema
(p. ej., "Siempre me siento triste y no puedo tolerarlo") casi con toda seguridad
coincidir tambin con las afirmaciones ms leves.
-
Mtodo de concordancia emprica
Es posible que el lector haya observado que la mayor parte de los mtodos de
escalamiento que se analizan en la seccin anterior dependen del juicio autorizado de
expertos para la seleccin y ordenacin de los reactivos. Tambin es posible construir
escalas de medicin que se basen por completo en consideraciones empricas ajenas
a la teora o el juicio experto. En el mtodo de concordancia emprica, los reactivos de
una prueba se seleccionan para una escala con base nicamente en qu tan bien
contrastan con un grupo criterio con respecto a una muestra normativa. Por ejemplo,
se podra obtener una escala de Depresin a partir de una reserva de preguntas de
93
falso-verdadero de un inventario de personalidad, como se ve a continuacin:

1. Se rene a un grupo cuidadosamente seleccionado y homogneo de personas que
experimenten depresin mayor, a fin de que respondan a la reserva de preguntas
de falso-verdadero.
2. En cada reactivo se compara la frecuencia
de confirmacin del grupo de depresin con
la de la muestra normativa.
3. Los reactivos que muestran una gran diferencia en frecuencia de confirmacin
entre las muestras con depresin y normativa se seleccionan para la escala de
Depresin, se codifican en la direccin favorecida por los individuos con depresin
(verdadero o falso, segn sea apropiado).
4. Entonces, la puntuacin en bruto de la escala de Depresin es sencillamente el
nmero de reactivos respondidos en la direccin codificada.
El mtodo de concordancia emprica puede producir algunas sorpresas interesantes.
Un descubrimiento comn es que algunos reactivos seleccionados para una escala
pueden no mostrar relacin obvia con el constructo a medir. Por ejemplo, un reactivo
como "Bebo mucho agua" (codificado como verdadero) podra terminar dentro de una
escala de Depresin. La fundamentacin momentnea para incluir este reactivo es
sencillamente que funciona. Por supuesto, el reto que se les presenta a los investigadores consiste en determinar por qu funciona el reactivo.
Construccin de escalamiento racional (consistencia interna)
El enfoque racional de la construccin de una escala es un mtodo popular para el

desarrollo de los inventarios de autoinforme. El nombre racional es en cierto modo
equivocado, ya que algunos mtodos estadsticos son esenciales para este enfoque.
Tambin, el nombre implica que otros enfoques no son racionales o son irracionales,
lo cual es falso. En el centro del mtodo de escalamiento racional se encuentra que
todos los reactivos de la escala se correlacionan en sentido positivo entre s y tambin
94
con la puntuacin total de la misma. Un nombre alternativo y ms apropiado para este

enfoque es el de consistencia interna, el cual enfatiza lo que en realidad se hace.
Supngase que un autor de pruebas desea desarrollar una nueva escala de
autoinforme para el potencial de liderazgo. Con base en una revisin de la literatura
pertinente, el investigador podra concluir que el potencial de liderazgo se caracteriza
por confianza en uno mismo, flexibilidad bajo presin, inteligencia elevada, capacidad
de persuasin, asertividad y la capacidad para percibir lo que otros piensan y sienten.
Estos conceptos sugieren que los siguientes reactivos de falso-verdadero podran ser
tiles en la evaluacin del potencial de liderazgo (Oough y Bradley, 1992):
En general tengo confianza y segundad en
m mismo. (V)
Cuando otras personas estn en desacuerdo
conmigo, en general me quedo en silencio o
cedo de algn otro modo. (F)
Creo que me encuentro notablemente por
encima del promedio en cuanto a capacidad
intelectual. (V)
Con frecuencia siento que tengo una comprensin
deficiente de la manera en que otras
personas reaccionarn ante las cosas. (F).
Es probable que mis amigos me describieran
como una persona fuerte y enrgica. (V)
La V y la F despus de cada afirmacin indican la direccin codificada de manera
racional para el potencial de liderazgo.
Por supuesto, tambin se propondran reactivos adicionales con intenciones similares.
El autor de la prueba podra comenzar con 100 reactivos que parecen con una base
racional evaluar el potencial de liderazgo. Estos reactivos preliminares se aplicaran
a una muestra amplia de individuos similares a la poblacin blanco a la que se dirige
95
la escala. Por ejemplo, si sta se disea para identificar a estudiantes universitarios

con potencial de liderazgo, entonces debera aplicarse a una muestra representativa
de varios cientos de estudiantes universitarios. Para el desarrollo de la escala son
deseables muestras muy grandes. En este caso hipottico, supngase que se
obtienen resultados con 500 estudiantes universitarios.
El siguiente paso en la construccin de un escalamiento racional consiste en
correlacionar las puntuaciones de cada uno de los reactivos preliminares con la
puntuacin total de la prueba para los 500 participantes en la muestra del piloteo.
Debido a que las puntuaciones en los reactivos son dicotmicas (se asigna de manera
arbitraria un 1 para la respuesta que corresponde a la clave de calificacin y O a la
alternativa), se requiere de un coeficiente r de correlacin biserial. Una vez que se
obtienen las correlaciones, el investigador busca en el listado las correlaciones dbiles
y las inversas (correlaciones negativas). Estos reactivos se descartan debido a que no
contribuyen a la medicin del potencial de liderazgo. Podran eliminarse hasta la mitad
de los reactivos originales. Si de inicio se descarta una gran proporcin de stos, el
investigador podra volver a calcular las correlaciones entre los reactivos y el total, con
base en una reserva reducida de aqullos para verificar la homogeneidad de los
restantes. Los reactivos que sobreviven a este procedimiento iterativo constituyen la
escala de potencial de liderazgo. El lector debera mantener en mente que el enfoque
racional para la construccin de escalas tan slo produce una homognea al medir un
constructo especificado. Se necesitaran estudios adicionales con nuevas muestras de
individuos para determinar la confiabilidad y validez de la nueva escala.
Construccin de Reactivos
Construir los reactivos de una prueba es un procedimiento doloroso y laborioso que

impone demandas a la creatividad de los autores de pruebas. Quien los redacta se
enfrenta con una profusin de preguntas inciales:
96
El contenido de los reactivos debe ser homogneo o variado?

Qu rango de dificultad deberan cubrir los reactivos?
Cuntos reactivos inciales deberan construirse?
Qu procesos cognitivos y dominios del reactivo deberan cubrirse?
Qu tipos de reactivos de prueba deberan utilizarse?
Preguntas inciales en construccin de pruebas
La primera pregunta tiene que ver con la homogeneidad contra la heterogeneidad en

el contenido de los reactivos de una prueba. En gran medida, aquello que dicta si el
contenido de los reactivos ha de ser homogneo o variado es la manera en que el
autor de la prueba ha definido al nuevo instrumento. Considrese una prueba
culturalmente reducida de la inteligencia general. Dicho instrumento podra incorporar
reactivos variados, en tanto las preguntas no supongan una escolaridad especfica. El
autor de la prueba podra tener la intencin de incorporar problemas novedosos que
sean igualmente desconocidos para todas las personas evaluadas. Por otro lado, con
una prueba de pensamiento espacial que se base en la teora, se requeriran
subescalas con reactivos que tengan contenido homogneo.
El rango de dificultad de los reactivos debe ser el suficiente como para dar lugar una
diferenciacin significativa de las personas evaluadas en ambos extremos. Entonces,
las pruebas ms tiles son aquellas que incluyen una serie graduada de reactivos muy
fciles, que aprueban casi todos, al igual que un grupo de stos cada vez ms difciles
que casi nadie aprueba. Se observa un efecto de lmite superior cuando nmeros
significativos de examinandos obtienen puntuaciones perfectas o casi perfectas. El
problema con el efecto de lmite superior es que no son posibles las distinciones entre
personas con puntuaciones elevadas, aunque estos individuos podran diferir de
manera sustancial en cuanto al rasgo subyacente que mide la prueba. Se observa un
efecto de lmite inferior cuando cantidades significativas de examinandos obtienen
97
puntuaciones que se encuentran cerca o en la parte ms baja de la escala. Por

ejemplo, el WAIS-R tiene un importante efecto de lmite inferior en cuanto a que no
puede discriminar entre los niveles moderado, grave y profundo de retraso mental
todas las personas con discapacidades significativas del desarrollo fallan en sus
respuestas a casi todas las preguntas.
Los autores de pruebas esperan que algunos de los reactivos inciales produzcan
contribuciones poco eficaces para el objetivo global de medicin de su instrumento.
Por esta razn, es comn la prctica de construir un primer borrador que contenga un
exceso de reactivos, quizs el doble del nmero de preguntas que se deseen para el
bosquejo final. Por ejemplo, el MMPI, que contiene 550 reactivos, originalmente
consista de ms de 1 000 afirmaciones de falso-verdadero acerca de la personalidad.
Pautas para la redaccin de reactivos de opcin mltiple
o Elija palabras que tengan significados precisos.
o Evite la sintaxis compleja o extraa.
o Incluya toda la informacin necesaria para la seleccin de la respuesta.
o Incluya lo ms posible de la pregunta dentro del planteamiento.
o No tome los planteamientos al pie de la letra de los libros de texto.
o Utilice opciones de igual extensin y fraseo paralelo.
o Utilice "ninguna de las anteriores" y "todas las anteriores" en raras
ocasiones.
o Reduzca al mnimo el empleo de negativos como no.
o Evite la utilizacin de palabras no funcionales.
o Evite la especificidad innecesaria en el planteamiento.
o Evite indicios innecesarios de la respuesta correcta.
o Presente los reactivos a otras personas para escrutinio editorial.
98
UNIDAD 2. APROXIMACIN AL USO DE LAS PRUEBAS PSICOLGICAS
Captulo 4. Las Pruebas y su Proceso de Aplicacin

Leccin 16. Definicin de una prueba
Una prueba es un procedimiento estandarizado para tomar una muestra de conducta y
describirla con categoras o puntuaciones. Adems, la mayor parte tiene normas o
estndares, con base en los cuales pueden utilizarse los resultados para pronosticar
otras conductas ms importantes. Incluidas dentro de esta perspectiva se encuentran
las pruebas tradicionales como los cuestionarios de personalidad y las pruebas de
inteligencia, pero la definicin tambin incluye diversos procedimientos que el lector
podra no reconocer como tales. Por ejemplo, todos los mtodos siguientes pueden
ser pruebas: una lista de verificacin para clasificar las habilidades sociales de un
joven con retraso mental; una medida sin lmite de tiempo del dominio en la suma de
pares de nmeros de tres dgitos; valoraciones por computadora del tiempo de
reaccin; e incluso, pruebas situacionales como la observacin de un individuo que
trabaja en una tarea de grupo con dos "ayudantes" poco cooperativos y que slo le
causan dificultades.
En suma, las pruebas son sumamente variadas en sus formatos y aplicaciones. Sin
embargo, la mayor parte posee estas caractersticas que las definen:
Procedimiento estandarizado.
Muestra de conducta.
Puntuaciones o categoras.
Normas o estndares.
Prediccin de conducta fuera de la prueba.
La imagen que se desea representar tiene que ver en especial con las pruebas
referentes a la norma las que utilizan una poblacin bien definida de personas para
su esquema interpretativo. Sin embargo, las caractersticas definitorias de una prueba
99
difieren un tanto en el caso especial de las pruebas referidas a criterio las que
miden lo que una persona puede hacer, en lugar de comparar los resultados con los
niveles de desempeo de otros. Por tal razn, se tratan por separado las pruebas
referidas a criterio.
El procedimiento estandarizado es una caracterstica esencial de cualquier prueba psicolgica. Se considera que una prueba est estandarizada si los procedimientos para
su aplicacin son uniformes de un examinador a otro y de un ambiente a otro. Por
supuesto, la estandarizacin depende, en cierto grado, de la capacidad del
examinador. Incluso la mejor prueba puede resultar intil en manos de un evaluador
descuidado, con entrenamiento deficiente o mal informado. Sin embargo, la mayora
de los examinadores son competentes. Por tanto, la estandarizacin depende en gran
medida de las disposiciones de aplicacin que se encuentran en el manual de
instrucciones que por lo comn acompaa a una prueba.
La formulacin de las instrucciones es un paso esencial para la estandarizacin de
una prueba. A fin de garantizar procedimientos uniformes de aplicacin, quien
desarrolla una prueba debe proporcionar materiales estmulo comparables para todos
los examinados, debe especificar con una precisin considerable las instrucciones
verbales para cada reactivo o subprueba y debe aconsejarle al examinador cmo ha
de manejar una diversidad de dudas por parte de la persona evaluada.
Para ilustrar estos puntos, considrense las diversas maneras en que una persona
que desarrolla una prueba podra enfocar la evaluacin de la retencin de dgitos el
nmero mximo de dgitos presentados verbalmente que un sujeto puede recordar de
memoria. Podra ser que una prueba no estandarizada de retencin de dgitos
sugiriera tan slo que el examinador presentara de manera verbal series cada vez
ms largas de nmeros hasta que el sujeto fallara. El nmero de dgitos en la serie
ms larga recordada sera, entonces, la capacidad de retencin de dgitos del sujeto.
La mayora de los lectores puede darse cuenta de que una prueba con tal definicin
tan general carecer de uniformidad de un examinador a otro. Si quien aplica la
100
prueba est en libertad de improvisar cualquier serie de dgitos, qu podra impedirle

que presentara, con la inflexin familiar de un locutor de televisin," 1 -800-325-3535"?
Tal serie sera bastante ms fcil de recordar que un conjunto ms aleatorio, por
ejemplo, "7-2-8-1-9-4-6-3-7-4-2". La velocidad de presentacin tambin puede tener
un efecto crucial sobre la uniformidad de una prueba de retencin de dgitos. Para
propsitos de estandarizacin, es esencial que todos los examinadores presenten
cada serie a una tasa constante; por ejemplo, un dgito por segundo. Por ltimo, el
examinador necesita saber cmo ha de reaccionar ante respuestas inesperadas,
como el que un sujeto le diga: "podra repetirlos de nuevo?" Por razones obvias, el
consejo habitual es "no".
Quien desarrolla una prueba puede incluso llegar hasta el punto de recomendar el
comportamiento deseado en el examinador, como mantener una expresin facial
neutra cuando se registra la respuesta de un sujeto. Estas influencias aparentemente
sutiles pueden tener un serio impacto sobre la uniformidad de los procedimientos de
prueba. Por ejemplo, un examinador que se sonre con displicencia cuando registra
las respuestas podra provocar que el sujeto se sienta ansioso y falle en una tarea fcil.
Una prueba psicolgica tambin es una muestra limitada de conducta. Ni el sujeto ni el
examinador tienen el tiempo suficiente para una prueba realmente amplia, incluso
cuando sta se dirige a un dominio conductual bien definido y finito. As, las
restricciones prcticas dictan que una prueba es slo una muestra de conducta. Sin
embargo, la muestra de conducta es de inters slo en la medida que permita que el
examinador realice inferencias acerca del dominio total de conductas relacionadas.
Por ejemplo, el propsito de una prueba de vocabulario consiste en determinar la
reserva completa de palabras de la persona examinada, al pedir definiciones de una
muestra muy pequea, pero cuidadosamente seleccionada, de palabras. El hecho de
que el sujeto pueda definir las 35 palabras particulares de una subprueba de vocabulario (p. ej., en el WAIS-R) es de poca consecuencia directa. Pero el significado de
101
dichos resultados es de gran importancia debido a que seala el conocimiento general

de vocabulario del individe evaluado.
Un punto interesante del que el pblico en general tiene poco conocimiento es
que los reactivos de prueba no necesitan parecerse a las conductas que la prueba
intenta pronosticar. La caracterstica esencial de una buena prueba es que permita
que el examinador pronostique otras conductas no que refleje aqullas a predecir.
Si responder "cierto" a la afirmacin "bebo mucha agua" ayuda a predecir la
depresin, entonces esta afirmacin, en apariencia no relacionada, es un ndice til de
la depresin. Por tanto, el lector observar que la prediccin exitosa es una cuestin
emprica que se resuelve a travs de la investigacin apropiada. Aunque la mayora
de las pruebas toman una muestra directa del dominio de conductas que esperan
predecir, ste no es un requisito psicomtrico.
Una prueba psicolgica tambin debe permitir la derivacin de puntuaciones o categoras. Las pruebas se esfuerzan en ser una forma de medicin similar a los
procedimientos de las ciencias fsicas, donde los nmeros representan dimensiones
abstractas como peso o temperatura. Toda prueba suministra una o ms puntuaciones
o proporciona evidencia de que una persona pertenece a una categora y no a otra. En
pocas palabras, las pruebas psicolgicas resumen la ejecucin en nmeros o clasificaciones.
La suposicin implcita del punto de vista psicomtrico es que las pruebas miden las
diferencias individuales en cuanto a rasgos o caractersticas que existen en cierto
sentido vago de la palabra. En la mayor parte de los casos, se supone que todas las
personas poseen el rasgo o caracterstica medida, aunque en diferentes cantidades.
El propsito de la prueba consiste en estimar la cantidad del rasgo o cualidad que
posee un individuo.
En este contexto, se deben hacer dos advertencias. Primero, toda puntuacin de prueba siempre reflejar cierto grado de error de medicin. La imprecisin de las pruebas
es simplemente inevitable: stas deben depender de una muestra externa de
102
conducta para estimar la caracterstica no observable y, por tanto, inferida. Con

frecuencia, los psicmetras expresan este punto fundamental con la ecuacin:
X=T+e
donde X es la puntuacin observada, T la puntuacin verdadera y e el componente de
error positivo o negativo. Lo mejor que puede hacer quien desarrolla una prueba es
procurar que e sea muy pequeo. Nunca se le puede eliminar por completo, como
tampoco se puede saber su impacto exacto sobre el caso individual.
La segunda advertencia es que los consumidores de pruebas deben prevenirse de
materializar las caractersticas medidas. Los resultados no representan una "cosa" que
tenga realidad fsica; por lo comn, representan una abstraccin que se ha
demostrado que tiene utilidad para pronosticar conductas externas a la prueba. Por
ejemplo, cuando se analiza el CI de una persona, los psiclogos se refieren a una
abstraccin que no tiene existencia directa, material, pero que, sin embargo, es til
para pronosticar el rendimiento escolar y otros resultados.
Una prueba psicolgica tambin debe poseer normas o estndares. En general, la
puntuacin de prueba de una persona se interpreta al compararla con las
puntuaciones obtenidas por otros individuos en la misma prueba. Para este propsito,
es comn que quienes desarrollan pruebas aplican normas un resumen de los
resultados de prueba de un grupo grande y representativo de personas. El grupo
normativo se conoce como muestra de estandarizacin.
La seleccin y evaluacin de la muestra de estandarizacin es crucial para la utilidad
de una prueba. Este grupo debe ser representativo de la poblacin a la que se dirige
la prueba o, de otra manera, no ser posible determinar la posicin relativa de un
individuo examinado. En el caso extremo donde no se proporcionan normas, el
examinador no puede utilizar en absoluto los resultados de la prueba. Una excepcin
a este punto ocurre en el caso de las pruebas referidas a criterio.
Las normas no slo establecen un desempeo promedio, sino que tambin sirven
para indicar la frecuencia con la que se obtienen diferentes puntuaciones altas y bajas
103
As, las normas permiten que el examinador determine el grado al que se desva una
puntuacin con respecto a las expectativas. Tal informacin puede ser muy importante
en la prediccin de la conducta externa a la prueba del individuo examinado. Las
normas tienen tal importancia trascendental en la interpretacin de pruebas, que
despus se les considerar con amplitud en una seccin independiente dentro de este
texto.
Por ltimo, las pruebas no constituyen un fin en s mismas. En general, el propsito
ltimo de una prueba consiste en pronosticar conductas adicionales, diferentes de
aquellas que se muestrean de manera directa en la prueba. As, el examinador puede
tener mayor inters en las conductas externas a la prueba pronosticadas por sta que
en las respuestas de prueba en s. Quizs un ejemplo concreto aclarar este punto.
Supngase que un examinador aplica una prueba de manchas de tinta a un paciente
en un hospital psiquitrico y que el paciente responde a una mancha de tinta
describindola como "ojos que se asoman sigilosamente". Con base en las normas
establecidas, el examinador podra pronosticar entonces que el sujeto es sumamente
suspicaz y obtendr poco beneficio de una psicoterapia individual.
Leccin 17. Tipos y usos de las pruebas

Las pruebas pueden agruparse de manera amplia en dos bandos: pruebas grupales y
pruebas individuales. Las pruebas grupales son medidas principalmente de lpiz y
papel, adecuadas para examinar a grandes grupos de personas a un mismo tiempo.
Las pruebas individuales son instrumentos que, por su diseo y propsito, deben
aplicarse a una sola persona. Una ventaja importante de estas ltimas es que el examinador puede estimar el nivel de motivacin del sujeto y evaluar la relevancia de
otros factores (p. ej., impulsividad o ansiedad) sobre los resultados de prueba.
Por conveniencia, las pruebas se clasificarn en ocho categoras representadas en;
cada una de ellas contiene pruebas referidas a la norma, referidas a criterio, indi-
104
viduales y grupales. El lector observar que cualquier tipologa de las pruebas es una
determinacin puramente arbitraria. Por ejemplo, podra postularse incluso otra
dicotoma: pruebas que buscan medir el desempeo mximo (p. ej., una prueba de
inteligencia) contra las que buscan estimar una respuesta tpica (p. ej., un inventario
de personalidad).
-
Principales tipos de pruebas psicolgicas:
Pruebas de inteligencia: miden la capacidad de un individuo en reas

relativamente globales como comprensin verbal, organizacin perceptual o
razonamiento y, por tanto, ayudan a determinar el potencial para el trabajo
escolar o para ciertas ocupaciones.
Pruebas de aptitud: miden la capacidad para una tarea o tipo de habilidad

relativamente especfica; en efecto, las pruebas de aptitud son una forma
estrecha de prueba de capacidad.
Pruebas de aprovechamiento: miden el grado de aprendizaje, xito o logro de

una persona en un tema o tarea.
Pruebas de creatividad: evalan el pensamiento novedoso y original y la

capacidad para encontrar soluciones poco comunes o inesperadas, en
especial, para problemas definidos de manera vaga.
Pruebas de personalidad: miden los rasgos, cualidades o conductas que

determinan la individualidad de una persona; dichas pruebas incluyen listas de
verificacin, inventarios y tcnicas proyectivas.
Inventarios de intereses: miden la preferencia de un individuo por ciertas

actividades o temas y, por tanto, ayudan a determinar la eleccin de carrera.
Procedimientos conductuales: describen de manera objetiva una conducta y

estiman su frecuencia, identificando los antecedentes y consecuencias de la
conducta.
Pruebas neuropsicolgicas: miden el desempeo cognoscitivo, sensorial,

perceptual y motor para determinar el grado, localizacin y consecuencias
105
conductuales del dao cerebral
En un sentido estricto, existen cientos de tipos diferentes de pruebas, cada una de las
cuales mide un aspecto ligeramente diferente del individuo. Por ejemplo, podra
discutirse que incluso dos pruebas de inteligencia constituiran diferentes tipos de
medida. Una prueba podra revelar la suposicin de que la inteligencia es un
constructo biolgico que puede medirse mejor a travs de las ondas cerebrales,
mientras otra podra fundamentarse en la perspectiva tradicional de que la inteligencia
se exhibe en la capacidad para aprender habilidades aculturadas como el vocabulario.
Agrupar ambas medidas bajo la categora de pruebas de inteligencia es con toda
seguridad una simplificacin exagerada pero, sin embargo, es un punto de partida til.
Las pruebas de inteligencia se disearon originalmente para tornar una muestra de
una amplia variedad de habilidades, a fin de estimar el nivel intelectual general del
individuo. Las escalas Binet-Simon tuvieron xito, en parte, debido a que incorporaban
tareas heterogneas, incluyendo definiciones de palabras, memoria de diseos,
preguntas de comprensin y tareas de visualizacin espacial. Las pruebas grupales de
inteligencia que florecieron con tal profusin durante y despus de la segunda Guerra
Mundial tambin medan capacidades diversas como lo demuestra la prueba Army
Alfa con sus ocho secciones diferentes que miden juicio prctico, informacin,
aritmtica y razonamiento, entre otras habilidades.
Las pruebas modernas de inteligencia tambin emulan este patrn histricamente
establecido al tomar una muestra de una amplia variedad de destrezas consideradas
importantes en nuestra cultura. En general, el trmino prueba de inteligencia se refiere
a una prueba que produce una puntuacin resumida general, basada en los resultados
de una muestra heterognea de reactivos. Por supuesto, una prueba de este tipo
podra tambin proporcionar un perfil de las puntuaciones de subprueba, pero es la
puntuacin general la que en trminos generales atrae la mayor atencin.
Una prueba de aptitud mide uno o ms segmentos claramente definidos y
106
relativamente homogneos de una capacidad; tiene dos variedades: pruebas de una

sola aptitud y bateras de prueba de aptitudes mltiples. Como es obvio, las primeras
evalan slo una capacidad, mientras que las segundas proporcionan un perfil de
puntuaciones para varias aptitudes.
Con frecuencia, las pruebas de aptitud se emplean para pronosticar el xito en una
profesin, curso de entrenamiento o esfuerzos educativos. Por ejemplo, las Medidas
Seashore de Talentos Musicales (Seashore, 1938), una serie de pruebas que cubren
tono, sonoridad, ritmo, tiempo, timbre y memoria tonal, pueden utilizarse para
identificar a nios que tienen un talento potencial para la msica. Tambin existen
pruebas de aptitudes especializadas para la evaluacin de habilidades en trabajo de
oficina, capacidades mecnicas, destreza manual y capacidad artstica.
El uso ms comn para las pruebas de aptitud consiste en determinar las admisiones
a la universidad. La mayora de los estudiantes universitarios estn familiarizados con
el SAT (del ingls Scliolastic Assessment Test; Prueba de Evaluacin Escolar, antes
llamada Scholastic Aptitude Test; Prueba de Aptitud Escolar) del Comit de Examen
de Ingreso a la Universidad. Esta prueba contiene una seccin Verbal, que destaca el
conocimiento de palabras y la comprensin de lectura, y una seccin de Matemticas,
que destaca el lgebra, la geometra y el razonamiento perspicaz. En efecto, las universidades que requieren con fines de admisin ciertas puntuaciones mnimas en el
SAT, utilizan la prueba para pronosticar el xito acadmico.
Las pruebas de aprovechamiento miden el grado de aprendizaje, xito o logro de
una persona en una materia. La suposicin implcita de la mayor parte de estas
pruebas es que las escuelas han enseado la materia de manera directa. Por tanto, el
propsito de la prueba consiste en determinar la cantidad del material que el sujeto ha
absorbido o dominado. En general, las pruebas de aprovechamiento tienen varias
subpruebas; por ejemplo, lectura, matemticas, lenguaje, ciencias naturales y ciencias
sociales, las cuales se revisan en el tema 8B, Pruebas grupales de aprovechamiento.
La distincin entre pruebas de aptitud y de aprovechamiento es ms una cuestin de
107
uso que de contenido (Gregory, 1994a). De hecho, cualquier prueba puede ser de
aptitud, en el sentido de que ayuda a pronosticar el desempeo futuro. De la misma
manera, cualquier prueba puede ser de aprovechamiento, en el sentido de que refleja
cunto ha aprendido el sujeto. Por tanto, en la prctica, la distincin entre estos dos
tipos de instrumentos se determina por sus respectivos usos. En ciertas ocasiones, un
instrumento puede servir para ambos propsitos, actuando como una prueba de
aptitud para predecir el desempeo futuro, y como prueba de aprovechamiento, para
supervisar el aprendizaje pasado.
Las pruebas de creatividad evalan la capacidad del sujeto para producir nuevas
ideas, discernimientos o creaciones artsticas que se consideran de valor social,
esttico o cientfico. As, las medidas de creatividad enfatizan la novedad y
originalidad en la solucin de problemas confusos o en la produccin de obras
artsticas.
Las pruebas de creatividad tienen una historia accidentada. En el decenio de 1960 se
les promocionaba como una alternativa til para las pruebas de inteligencia y se les
utiliz ampliamente en los sistemas educativos de EUA. Los educadores se mostraron
especialmente impresionados de que las pruebas de creatividad requirieran del
pensamiento divergente empleando una variedad de respuestas para un problema
complejo o confuso en oposicional pensamiento convergente encontrando una
solucin correcta nica para un problema bien definido. Por ejemplo, una prueba de
creatividad podra pedirle al individuo examinado que imaginara todas las cosas que
sucederan si las nubes tuvieran cuerdas que colgaran de ellas hasta el piso (Guilford,
1954). Se supona que los alumnos que pudieran dar un gran nmero de
consecuencias eran ms creativos que sus compaeros menos imaginativos. Sin embargo, algunos psicmetras se mostraron escpticos, concluyendo que la creatividad
es slo otra etiqueta para la inteligencia aplicada (p. ej., McNemar, 1964).
Las pruebas de personalidad miden los rasgos, cualidades o conductas que
determinan la individualidad de una persona; esta informacin ayuda a pronosticar la
108
conducta. Estas pruebas pueden encontrarse en muchas variedades diferentes,

incluyendo listas de verificacin, inventarios y tcnicas proyectivas como frases
incompletas y manchas de tinta.
Los inventarios de intereses miden la preferencia de un individuo por ciertas
actividades o temas y, con ello, ayudan a determinar la eleccin de carrera; se basan
en la suposicin explcita de que los patrones de inters determinan y, por tanto,
tambin predicen la satisfaccin con el trabajo. Por ejemplo, si la persona examinada
tiene los mismos intereses que los contadores exitosos y satisfechos, se considera
probable que disfrutar del trabajo de un contador. La suposicin de que los patrones
de inters pronostican la satisfaccin con el trabajo se confirma en gran medida a
travs de estudios empricos.
Existen
muchos
tipos
de
procedimientos
conductuales
para
evaluar
los
antecedentes y consecuencias de la conducta, incluyendo listas de verificacin,

escalas de clasificacin, entrevistas y observaciones estructuradas. Estos mtodos
comparten una suposicin comn de que la conducta puede comprenderse mejor en
trminos de caractersticas definidas de manera clara como frecuencia, duracin,
antecedentes y consecuencias. Los procedimientos conductuales tienden a ser
sumamente pragmticos en el sentido de que generalmente se encuentran
entretejidos con enfoques de tratamiento.
Las pruebas neuropsicolgicas se utilizan para la evaluacin de personas de las
que se sospecha o se sabe que tienen una disfuncin cerebral. La neuropsicologa es
el estudio de las relaciones cerebro-conducta. A travs de los aos, los
neuropsiclogos han descubierto que ciertas pruebas y procedimientos son muy sensibles a los efectos del dao cerebral, y emplean estas pruebas y procedimientos
especializados
para
hacer
inferencias
acerca
de
la
localizacin,
grado
consecuencias de dicho dao.

Aunque las pruebas y procedimientos neuropsicolgicos son tiles para llegar a un
diagnstico neurolgico, su principal propsito consiste en valorar las fortalezas y
109
debilidades sensoriales, motoras, cognitivas y conductuales de un paciente con

alteracin neurolgica. La evaluacin de fortalezas y debilidades en estos pacientes
es crucial para documentar la mejora, proyectar el grado de deterioro en los
padecimientos degenerativos y planificar tratamientos efectivos para incapacidades
especficas.
Leccin 18. Procesos de aplicacin estandarizados

La interpretacin de una prueba psicolgica es ms confiable cuando las mediciones
se
obtienen
bajo
las
condiciones
estandarizadas.
Los
procedimientos
no
estandarizados pueden alterar el significado de los resultados de la prueba, que

pueden resultar invlidos y, por tanto, engaosos.
En las aplicaciones tpicas, quienes aplican una prueba deben seguir de manera
cuidadosa los procedimientos estandarizados para la aplicacin y calificacin que
especifica el editor de la prueba. Las especificaciones concernientes a las
instrucciones para las personas examinadas, lmites de tiempo, forma de presentacin
o respuesta del reactivo y materiales o equipo de prueba deben observarse de manera
estricta. Slo deben hacerse excepciones con base en el juicio profesional
considerado de modo cuidadoso, principalmente en las aplicaciones clnicas (AERA,
APA, NCME, 1985)
Supngase que las instrucciones para la seccin de vocabulario de una prueba de
inteligencia para nios especifica que el examinador debe preguntar: "qu significa la
palabra divn, qu es un divn?" Si el sujeto respondiera "nunca he escuchado esa
palabra", un examinador sin experiencia podra sentirse tentado a responder: "ya
sabes, un sof qu es un sof?" Esto podra parecerle al lector como una forma
inocente de juego limpio, un simple refraseo de la pregunta original. Sin embargo, al
alejarse de los procedimientos estandarizados, el examinador ha aplicado en realidad
otra prueba. El punto de pedir la definicin de divn (y no sof) es precisamente que
divn es ms difcil de definir y, por tanto, es un mejor ndice de habilidades de nivel
110
superior en cuanto a vocabulario.

Aunque los procedimientos estandarizados de prueba son normalmente esenciales,
existen casos en que es deseable, o incluso necesaria, la flexibilidad en los
procedimientos. Como lo sugieren las normas de la APA, dichas desviaciones deben
ser razonadas y deliberadas. Aqu es pertinente realizar una analoga entre el espritu
y la letra de la ley. Un examinador demasiado entusiasta podra captar, por un decir, la
letra de la ley al adherirse de manera literal y estricta a los procedimientos de prueba
expresados en el manual de edicin. Pero, en realidad sta era la intencin del
editor? Siquiera es la manera en que, en realidad, se aplic la prueba a la muestra
normativa? Es ms probable que los editores preferiran que los examinadores
captaran el espritu de la ley incluso si, en ocasiones, fuera necesario adaptar un tanto
los procedimientos de la prueba.
Considrese la siguiente situacin que surgi cuando un psiclogo le aplic una
prueba estandarizada de inteligencia a una estudiante universitaria ansiosa y
demasiado concreta. Cuando se le pregunt: "cuntos son cuatro dlares ms cinco
dlares?", la estudiante respondi: "cuatro dlares son cuatro dlares y cinco dlares
son cinco dlares". Una interpretacin literal del manual de prueba requerira que el
examinador registrara un crdito de cero y prosiguiera con el siguiente reactivo. Sin
embargo, la pregunta tena el propsito de examinar las habilidades aritmticas y no lo
concreto del pensamiento. As, el examinador hizo de nuevo la pregunta con un ligero
cambio en cuanto a nfasis: "cuntos son cuatro dlares y cinco dlares?" La sujeto
lanz una fuerte carcajada y respondi de inmediato "nueve dlares no me percat
de que era una pregunta de aritmtica".
Los ajustes menores a los procedimientos, que se adhieren al espritu en el que se
desarroll la prueba, ocurren de manera regular y no son causa de alarma. Estas
adaptaciones menores no invalidan las normas establecidas por el contrario, la
adaptacin apropiada de los procedimientos es necesaria de modo que las normas
puedan continuar siendo vlidas. Despus de todo, los examinadores que
111
recolectaron dalos sobre la muestra de estandarizacin no actuaron como autmatas

sin corazn cuando presentaron las preguntas a los sujetos. Los examinadores que
deseen obtener resultados vlidos deben ejercer, del mismo modo, una flexibilidad
razonada en los procedimientos de prueba.
Sin embargo, es necesario tener una considerable experiencia clnica para determinar
si un ajuste en el procedimiento es menor o tan sustancial que las normas existentes
ya no pueden aplicarse. sta es la razn por la cual los examinadores en psicologa
pasan, por lo comn, por una extensa experiencia supervisada antes de que se les
permita aplicar e interpretar pruebas individuales de capacidad o de personalidad.
Leccin 19. Procesos de aplicacin deseables

Se analizarn primero las pruebas individuales y despus se enumerarn de manera
breve algunos puntos importantes acerca de los procedimientos deseables en las
pruebas con grupos.
Un componente esencial de las pruebas individuales es que los examinadores deben
familiarizarse ntimamente con los materiales e instrucciones antes de comenzar con
la aplicacin. En su mayora, esto implica extensos ensayos y anticipacin de las
circunstancias poco comunes y de la respuesta apropiada. Un examinador bien
preparado tiene memorizados los elementos clave de las instrucciones verbales y est
listo para manejar lo inesperado.
Con frecuencia, el estudiante de evaluacin inexperto supone que los procedimientos
de examen son tan sencillos y simples que una sola lectura rpida del manual ser
suficiente como preparacin para la prueba. Aunque algunas pruebas individuales son
sumamente rudimentarias y poco complicadas, muchas de ellas tienen aspectos
complejos de aplicacin que, si no se toman en cuenta, pueden causar que el
individuo examinado falle de manera innecesaria en los reactivos. Por ejemplo, Choi y
Proctor (1994) encontraron que 25 entre 27 estudiantes de posgrado cometan serios
errores en la aplicacin de la Stanford-Binet: Cuarta Edicin, incluso aunque se
112
videogrababan las sesiones y los estudiantes saban que se evaluaran sus

habilidades de prueba. La atencin apropiada a los detalles de aplicacin es esencial
para obtener resultados vlidos.
La necesidad de tener una ntima familiaridad con los procedimientos de prueba se
ilustra muy bien en la subprueba de Diseo con Cubos del WAIS-III (Wechsler, 1997).
Los materiales para la subprueba incluyen nueve bloques (cubos) de color rojo en dos
lados, blanco en dos lados y rojo y blanco en dos lados. La tarea de la persona
evaluada consiste en utilizar los cubos para construir patrones representados en
tarjetas. Para los diseos iniciales se necesitan cuatro cubos, mientras que en los diseos ms difciles se utilizan los nueve cubos.
Los individuos inteligentes no tienen dificultad para comprender esta tarea y las
instrucciones exactas no influyen de manera apreciable en su desempeo. Sin
embargo, las personas cuya inteligencia es promedio o inferior a ste requieren de las
elaboradas demostraciones y correcciones que se especifican en el Manual del WAISIII (Wechsler, 1997). En particular, el examinador muestra los primeros dos diseos y
responde al xito o fracaso del examinado en ellos, segn un flujo complejo de
reaccin y contrarreaccin como se presenta en las tres pginas de instrucciones. Lo
sentimos por el examinador que no ha ensayado esta subprueba y anticipado la
respuesta apropiada para las personas que fallan en los primeros dos diseos.
-
Sensibilidad hacia las discapacidades
Otro ingrediente importante de la aplicacin vlida de una prueba es la sensibilidad a

las discapacidades de la persona evaluada. Las discapacidades en audicin, visin,
habla o control motor pueden distorsionar gravemente los resultados de prueba. Si el
examinador no reconoce la discapacidad fsica responsable del desempeo deficiente
en la prueba, puede clasificarse al sujeto como discapacitado a nivel intelectual o
emocional cuando, de hecho, el problema esencial es una discapacidad sensorial o
motora.
113
Vernon y Brown (1964) informaron sobre el trgico caso de una nia pequea a la que
se le releg a un hospital para individuos con retraso mental, como consecuencia de la
insensibilidad del examinador hacia una discapacidad fsica. El examinador no se dio
cuenta de que la nia era sorda y concluy que el CI de 29 en la Stanford-Binet era
vlido. La nia permaneci en el hospital durante cinco aos, pero se le dio de alta
despus de que obtuvo un CI de 113 en una prueba de inteligencia basada en el
desempeo. Despus de dejar el hospital, ingres a una escuela para sordos y logr
buen progreso.
Las pruebas vlidas con sujetos que tienen discapacidades auditivas requieren antes
que nada que el examinador detecte la existencia de la discapacidad! Con frecuencia
esto es ms difcil de lo que parece. Muchas personas con una prdida auditiva leve
aprenden a compensar su discapacidad fingiendo que comprenden lo que otros dicen
y esperando que las siguientes seales dentro de la conversacin les ayuden a aclarar
las palabras o frases percibidas apenas. Como resultado, otras personas incluyendo
los psiclogos pueden no darse cuenta de que el individuo con una alteracin
auditiva leve tiene alguna discapacidad.
Las indicaciones de una posible dificultad auditiva incluyen falta de respuesta normal
ante el sonido, falta de atencin, dificultades para obedecer instrucciones orales,
observacin intensa de los labios del hablante y articulacin deficiente (Sattler, 1988).
En todos los casos donde se sospecha la existencia de una alteracin auditiva, es
crucial canalizar al sujeto a un examen audiolgico. Si se confirma un problema
auditivo grave, entonces el examinador debera considerar el uso de una de las
pruebas especializadas. En el caso de personas con una prdida auditiva leve, es
esencial que el examinador se coloque de frente al sujeto, hable ms fuerte y repita
las instrucciones lentamente. Tambin es importante localizar una habitacin
silenciosa para la prueba. De manera ideal, dicha habitacin tendr cortinas y
superficies con textura en las paredes para reducir al mnimo los efectos distractores
de los ruidos de fondo.
114
En contraste con los individuos que tienen alteraciones auditivas, las personas con
discapacidades visuales generalmente atienden bien a los materiales de prueba
presentados de modo verbal. La persona con alteraciones visuales introduce un tipo
diferente de reto para el examinador; delectar la existencia de una alteracin visual y
despus, asegurarse de que el sujeto puede ver bien los materiales de prueba.
La visin borrosa o doble puede significar problemas visuales, como los dolores de
cabeza o las nuseas despus de leer. En general, es tan comn que los nios
requieran anteojos correctores, que los examinadores deben estar alertas a un
problema de visin en cualquier sujeto joven que no utilice anteojos y que no haya
pasado por un examen reciente de la visin.
Las alteraciones del habla representan otro problema para quienes deben hacer un
diagnstico. Las respuestas verbales de las personas con alteraciones del habla son
difciles de descifrar. Debido a la incapacidad del examinador para entender las
respuestas, los sujetos pueden recibir un menor crdito del que merecen
Incluso si su discapacidad es leve, las personas con parlisis cerebral u otras
alteraciones motoras pueden recibir penalizacin en pruebas de ejecucin con lmite
de tiempo. Cuando se somete a prueba a una persona con una discapacidad motora
leve, los examinadores podran omitir las subpruebas de ejecucin cronometradas o
descontar estos resultados si son consistentemente ms bajos que las puntuaciones
de las subpruebas sin lmite de tiempo Si un sujeto tiene una discapacidad motora
obvia como lo es una dificultad para manipular las piezas de un rompecabezas
entonces los instrumentos estndar aplicados de manera normal son generalmente
inapropiados. Se han desarrollado de manera expresa varios instrumentos alternativos
para examinar a personas con parlisis cerebral y otras alteraciones motoras y las
pruebas estndar se han adaptado de modo ingenioso y se han establecido nuevas
normas para estas adaptaciones.
115
Procedimientos deseables con pruebas de grupo
Por lo comn, los psiclogos y educadores suponen que casi cualquier adulto puede
aplicar de manera adecuada las pruebas grupales, en tanto tenga el manual
requerido. La aplicacin de una prueba grupal parecera un procedimiento simple y
sencillo en el que se pasan los formatos y lpices, se leen las instrucciones, se toma
el tiempo y se recogen los materiales.
En realidad, conducir una prueba grupal requiere tanto refinamiento como aplicar una
prueba individual. Sin duda, la ms grande fuente de error en la aplicacin de una
prueba grupal tiene que ver con tomar de manera inadecuada el tiempo en las
pruebas cronometradas. Los examinadores deben conceder el tiempo suficiente para
el proceso completo de prueba: organizacin, lectura de las instrucciones en voz alta y
presentacin de la prueba en s por parte de los sujetos. Conceder el tiempo suficiente
requiere previsin en la programacin. Por ejemplo, en muchos ambientes escolares,
los nios deben proceder a la siguiente clase en un horario establecido, sin considerar
las actividades en proceso. Los examinadores sin experiencia podran sentirse
tentados a reducir el lmite de tiempo designado para una prueba, de modo que se
pueda respetar el horario de la escuela. Por supuesto, reducir el tiempo en una prueba
causa que las normas sean completamente invlidas y con toda probabilidad reduce la
puntuacin de la mayora de los sujetos en el grupo.
Conceder demasiado tiempo para una prueba puede constituir tambin un tremendo
error. Por ejemplo, considrese el impacto de recibir tiempo adicional en la Miller
Analogies Test (MAT; Prueba de Analogas de Miller), una prueba de razonamiento de
alto nivel que en algn tiempo requirieron muchas universidades para la solicitud de
ingreso al posgrado. Dado que la MAT es una prueba con lmite de tiempo que
necesita de pensamiento analgico rpido, conceder ms tiempo permitira que la
mayora de los individuos examinados resolvieran vanos problemas adicionales. Es
probable que este tipo de error de prueba disminuyera la validez de los resultados de
la MAT, como mecanismo de prediccin del desempeo en el posgrado.
116
Una segunda fuente de error en la aplicacin de pruebas grupales es la falta de

claridad en las instrucciones para los examinados. Los examinadores deben leer las
instrucciones con lentitud, con una voz clara y fuerte que atraiga la atencin de los
sujetos. Las instrucciones no deben parafrasearse. Cuando el manual lo permite, los
examinadores deben detenerse en la lectura y aclarar las dudas de los individuos que
tienen alguna confusin.
Las variaciones en las condiciones fsicas de aplicacin de prueba constituyen una
tercera fuente de error potencial en la conduccin de una prueba grupal. Los
examinadores deben asegurarse de que la habitacin de examen est bien iluminada
y, de ser necesario, que tenga calefaccin o aire acondicionado para controlar las
variaciones extremas en cuanto a temperatura y humedad. Es poco comn que los
autores de pruebas entren en detalles sobre las especificaciones relativas a
iluminacin, temperatura y humedad, dado que los examinadores y sujetos, con unas
cuantas excepciones, tendrn que tolerar las condiciones existentes. Sin embargo, es
obvio que los examinandos no pueden tener un desempeo ptimo si se les somete a
prueba en una habitacin con iluminacin pobre o que es demasiado fra u
opresivamente caliente y hmeda. Los examinadores previsores deberan hacerle el
favor a sus examinados de programar que las pruebas grupales importantes se
presenten en un ambiente agradable y bien iluminado.
La importancia de la superficie de escritura se aumenta por la tendencia actual a
utilizar hojas separadas de respuesta. Los sujetos necesitan de un espacio ms
amplio de escritorio cuando emplean hojas separadas de respuesta que bajo otras
condiciones. Aunque pocos editores de prueba lo sealan, sera bueno especificar en
los manuales de prueba las variaciones admisibles en cuanto a superficie de escritura
que de todos modos permiten resultados comparables de prueba.
El ruido es otro factor que debe controlarse en las pruebas grupales. Durante algn
tiempo se ha sabido que el ruido provoca una disminucin en el desempeo, en
especial para tareas de alta complejidad (p. ej. Boggs y Simn, 1968). Es de
117
sorprender que exista poca investigacin acerca de los efectos del ruido en las
pruebas psicolgicas. Sin embargo, parece casi seguro que el ruido fuerte, en especial
si es intermitente e imposible de predecir, causar que las puntuaciones de prueba se
reduzcan de manera sustancial. No se puede esperar que los nios en una escuela
primaria tengan un buen desempeo mientras que un obrero de la construccin
golpea con un marro una pared de cemento en la habitacin contigua. Para ser justos
con los examinandos, existen ocasiones en las que debe reprogramarse la aplicacin
de la prueba.
Una cuarta fuente de error en la aplicacin de una prueba grupal es la incapacidad
para explicar cundo pueden adivinarse las respuestas y si est permitido hacerlo.
Quiz con ms frecuencia que cualquier otra duda, a los examinadores se les
pregunta si "existe alguna sancin por adivinar mal una respuesta?" En la mayora de
los casos, quienes desarrollan pruebas anticipan esta cuestin y proporcionan pautas
explcitas para los sujetos en cuanto a las ventajas, desventajas, o ambas, de
conjeturar una respuesta. Los examinadores no deben dar consejo adicional sobre
adivinar las respuestas ello constituira una grave desviacin con respecto al
procedimiento estandarizado.
La mayora de quienes desarrollan pruebas incorporan una correccin de conjeturas
basada en principios establecidos de probabilidad. Considrese una prueba de opcin
mltiple que tiene cuatro alternativas por reactivo. En aqullos donde el sujeto realiza
una conjetura aleatoria, sin tener el conocimiento, las probabilidades de estar en lo
correcto son de 1 entre 4, mientras que las probabilidades de estar mal son de 3 entre
4. As, por cada tres conjeturas incorrectas, habr una correcta que refleje la suerte
ms que el conocimiento. Supngase que una nia responde correctamente a 35
preguntas de una prueba de 50 reactivos, pero en nueve preguntas sus respuestas
son errneas. En total ha respondido a 44 preguntas, dejando seis sin responder. El
hecho de que haya elegido la alternativa incorrecta en nueve preguntas sugiere que
ha obtenido tres respuestas correctas por suerte ms que por conocimiento.
118
Recurdese que, en el caso de las conjeturas aleatorias, se espera que haya, en

promedio, tres respuestas errneas por cada respuesta correcta, de modo que para
nueve respuestas incorrectas se esperaran tres conjeturas correctas en otras
preguntas. La puntuacin corregida de la nia aquella que de hecho se informa y se
compara con las normas existentes sera entonces de 32, es decir, 35 menos 3. En
otras palabras, es probable que conociera 32 respuestas, pero al adivinar en otras 12
aument su puntuacin en otros 3 puntos.
La correccin para la puntuacin que se ejemplifica en el prrafo anterior, se refiere
slo a las respuestas aleatorias, sin conocimientos.
El efecto de tal correccin consiste en eliminar las ventajas que de otra manera se
concederan a quienes toman riesgos de manera aventurada. En algunos casos, un
individuo examinado puede eliminar una o dos de las alternativas, con lo cual aumenta
las probabilidades de adivinar correctamente entre las opciones restantes. En esta
situacin puede ser adecuado que la persona trate de adivinar la respuesta.
Un redactor hbil de reactivos puede disear preguntas de modo que la alternativa
correcta sea totalmente contraria a la intuicin y las alternativas incorrectas tengan
una cualidad persuasivamente atractiva. Para estos reactivos, una conjetura basada
en conocimientos es casi siempre incorrecta.
Ya sea que una prueba grupal utilice o no una correccin para la puntuacin, el punto
importante reside en enfatizar en este contexto que quien aplica la prueba debe seguir
el procedimiento estandarizado y nunca ofrecer consejo adicional acerca de adivinar
las respuestas. En las pruebas grupales, las desviaciones con respecto al manual de
instrucciones son simplemente inaceptables.
119
Leccin 20. Influencias del evaluador y del evaluado

-
La importancia del rapport
Los editores de pruebas instan a los examinadores a establecer un rapport una

atmsfera cmoda y clida que sirva para motivar a los examinandos y que produzca
la cooperacin. Dar lugar a un ambiente cordial para la prueba es un aspecto crucial
de una prueba vlida. Un examinador que no establece rapport puede provocar que
una persona reaccione con ansiedad, falta de cooperacin de naturaleza pasivoagresiva u hostilidad abierta. El fracaso para establecer el rapport distorsiona los datos
de la prueba: se subestima la capacidad y se hace un juicio inadecuado de la
personalidad.
El rapport es de particular importancia en las pruebas individuales y en particular
cuando se evala a nios. Wechsler (1974) ha sealado que el establecimiento del
rapport crea fuertes demandas sobre las habilidades clnicas del examinador:
Debe lograr que el nio se sienta cmodo, mantenerlo interesado en las tareas en
cuestin y alentarlo a realizar su mejor esfuerzo. No existe una frmula mgica para
"ganarse" al nio; las aproximaciones que tienen xito con algunos nios pueden
enfadar a otros. Con experiencia, el examinador desarrollar una receptividad que le
permitir establecer relaciones cordiales con los nios y adaptarse a las necesidades
especificas de cada uno. Las sugerencias generales que aparecen a continuacin se
ofrecen para ayudar al examinador en sus esfuerzos.
Para lograr que el nio se sienta cmodo con su entorno, el examinador podra hacer
que participe en alguna conversacin informal, antes de adentrarse en el asunto ms
serio de aplicar de sus pasatiempos o intereses es una buena maneta de romper el
hielo, aunque en el caso de un nio tmido, puede ser mejor alentarlo a que hable
sobre algn aspecto concreto del ambiente un cuadro en la pared, un animal en el
saln de clases o un libro o juguete (que no sea parte del material de prueba) en la
habitacin de examen. En general, este periodo introductorio no requiere ms de 5 a
120
10 minutos, aunque la prueba no debe comenzar hasta que el nio parezca lo

suficientemente relajado como para dar su mximo esfuerzo.
Un estudio de Gregory, Lehman y Mohn (1976) ilustra la importancia de establecer

rapport cuando se examina a los nios. Estos investigadores buscaron determinar los
efectos del bajo nivel de exposicin al plomo sobre el CI al aplicar el WISC a 193
nios que vivan cerca de una fundicin de plomo. Los nios se asignaron a cinco
diferentes estudiantes de posgrado que aplicaron las pruebas, con base en una rotacin casi aleatoria en la que el examinador que estuviera libre atenda al primer nio
que llegara. Los grupos de nios sometidos a prueba por cada uno de los cinco
psicmetras no diferan en el promedio de edad, exposicin al plomo o clase social. Lo
que es ms, las magnitudes de las muestras eran sustanciales, ya que su nmero iba
de los 30 a los 45 nios. De aqu que el promedio de los CI examinados dentro de los
cinco grupos debera haber sido muy similar.
Sin embargo, las diferencias entre los CI examinados en los cinco grupos fueron penosamente grandes, con puntuaciones promedio que variaban hasta 14 puntos.
Clasificadas de menor a mayor, las puntuaciones promedio de los cinco grupos fueron
90, 94, 95,96 y 104. El examinador cuyos sujetos obtuvieron en promedio un CI de 90
era muy formal, preciso, fro y apresurado. De hecho examin con mucho a la mayora
de los sujetos (45, en comparacin con 37 del siguiente examinador ms prolfico) y,
en general, terminaba mucho antes con cada nio. En el otro extremo se encontraba
el examinador, cuyos sujetos obtuvieron un CI promedio de 104. Fue mucho ms all
del buen rapport, hasta llegar al grado de ofrecer apoyo y aliento que rayaba en conducir a los sujetos a la respuesta correcta. Por ejemplo, en Diseo con Cubos inst a
un nio a "Vamos, coloca los cubos de las esquinas y sigue a partir de all".
Por tanto, los examinadores pueden diferir en cuanto a sus capacidades para
establecer rapport. Es probable que los examinadores fros obtengan menos
cooperacin de sus sujetos, lo cual tiene como consecuencia que se reduzca el
121
desempeo en una prueba de capacidad o que se obtengan resultados distorsionados

o defensivos en pruebas de personalidad. Los examinadores demasiado solcitos
pueden errar en la direccin opuesta, dando seales sutiles (y en ocasiones ms que
obvias) de las respuestas correctas. Se deben evitar ambos extremos.
La persona examinada
Los examinandos difieren no slo en las caractersticas que los examinadores desean
evaluar, sino tambin en otros aspectos ajenos que podran alterar los resultados de
prueba. Por ejemplo, un individuo inteligente podra tener un desempeo deficiente en
una prueba cronometrada de la capacidad debido a ansiedad ante sta; un asesino
cuerdo podra tener el propsito de parecer mentalmente enfermo en un inventario de
personalidad con la finalidad de evitar una acusacin; un estudiante con capacidad
promedio podra prepararse para tener un mejor desempeo en una prueba de
aptitud. Algunos sujetos carecen totalmente de motivacin y no les interesa si obtienen
un buen resultado en pruebas psicolgicas. En todos estos casos, los resultados de
prueba pueden ser imprecisos debido a los efectos penetrantes y causantes de
distorsin de ciertas caractersticas del examinando como la ansiedad, simulacin, entrenamiento o antecedentes culturales.
-
Ansiedad ante la prueba
La ansiedad ante la prueba se refiere a aquellas respuestas fenomenolgicas,

fisiolgicas y conductuales que acompaan a la preocupacin acerca del posible
fracaso en una prueba. No hay duda de que los sujetos experimentan diferentes
niveles de ansiedad ante la prueba, que van desde una actitud despreocupada, hasta
un temor incapacitante ante el prospecto de que se les someta a prueba.
Un amplio cuerpo de investigacin ha confirmado el concepto de sentido comn de
que la ansiedad ante la prueba se correlaciona en sentido negativo con el rendimiento
escolar, las puntuaciones de pruebas de aptitud y las medidas de inteligencia (Naveh-
122
Benjamin, McKeachie y Lin, 1987; McKeachie, 1984). Sin embargo, la interpretacin

de estos descubrimientos de correlacin no es simple. Una posibilidad es que los
estudiantes desarrollen ansiedad ante la prueba, debido a antecedentes de tener un
mal desempeo en los exmenes. Es decir, las disminuciones en desempeo pueden
anteceder y causar dicha ansiedad. En apoyo a este punto de vista, Paulman y
Kennelly (1984) encontraron que con independencia de su ansiedad muchos
estudiantes con ansiedad ante la prueba tambin tenan ineficiencias en presentacin
de exmenes en ambientes acadmicos. Dichos estudiantes lograban pobres
resultados en pruebas, estuvieran ansiosos o no. Lo que es ms, Naveh-Benjamin,
McKeachie y Lin (1987) determinaron que una gran proporcin de estudiantes
universitarios con ansiedad ante la prueba tenan malos hbitos de estudio que los
predisponan a un pobre desempeo en pruebas. La ansiedad de estos individuos es,
en parte, un subproducto de la frustracin que ha tenido toda la vida con respecto a
resultados mediocres en pruebas.
Otras lneas de investigacin indican que la ansiedad ante la prueba tiene un efecto
perjudicial directo sobre el desempeo en pruebas. Es decir, es probable que esta
ansiedad sea tanto una causa como un efecto en la ecuacin que la vincula con el
desempeo deficiente en pruebas. Considrese el estudio original que realiz Sarason
(1961) sobre este tema, quien someti a prueba a sujetos con alta y baja ansiedad
bajo instrucciones neutras o inductores de ansiedad. Los sujetos eran estudiantes universitarios a los que se les pidi que memorizaran palabras de dos slabas con un bajo
nivel de significado una tarea difcil. La mitad de los sujetos trabaj bajo
instrucciones neutras simplemente se les dijo que memorizaran las listas. A los
sujetos restantes se les dijo que memorizaran las listas y que la tarea era una prueba
de inteligencia. Se les inst a tener el mejor desempeo posible. Los dos grupos no difirieron de manera significativa en su desempeo cuando las instrucciones eran
neutras y no amenazantes. Sin embargo, cuando stas excitaban la ansiedad, los
niveles de desempeo de los sujetos con alto grado de ansiedad descendieron de
123
modo notable, dejndolos con una enorme desventaja, en comparacin con aquellos
que tenan baja ansiedad. Esto indica que los sujetos con ansiedad ante la prueba
muestran disminuciones significativas en su desempeo cuando perciben la situacin
como una prueba. En contraste, los sujetos con bajo nivel de ansiedad sufren un
efecto relativamente nulo de tal redefinicin simple del contexto.
Las pruebas con estrictos lmites de tiempo representan un problema especial para las
personas con altos niveles de ansiedad ante la prueba. La presin de tiempo parece
exacerbar el grado de amenaza personal, causando reducciones significativas en el
desempeo de las personas con ansiedad ante la prueba. Siegman (1956) demostr
este punto hace muchos aos al comparar los niveles de desempeo de pacientes
mdicos/psiquitricos con alta y baja ansiedad en las subpruebas con y sin lmite de
tiempo del WAIS. El WAIS consiste de 11 subpruebas que incluyen seis subpruebas
para las cuales el examinador utiliza un cronmetro, a fin de imponer estrictos lmites
de tiempo y cinco subpruebas para las cuales el sujeto tiene un tiempo ilimitado de
respuesta. Es interesante que los sujetos con alta y baja ansiedad tuvieran una
capacidad total idntica en el WAIS. Sin embargo, cada grupo tuvo un mejor
desempeo en la direccin prevista en los diferentes tipos de subpruebas. En
particular, los sujetos con bajo nivel de ansiedad superaron a aqullos con ansiedad
elevada en las subpruebas con lmite de tiempo, mientras que se observ el patrn
inverso en las subpruebas sin lmite de tiempo.
-
Motivacin para el engao
Los resultados de prueba pueden ser imprecisos si la persona tiene razones para
desempearse de una manera inadecuada o no representativa. El falseamiento
abierto de los resultados de prueba es poco comn, pero llega a suceder. Una
pequea fraccin de personas que buscan beneficiarse de la rehabilitacin o de
instituciones sociales "se fingirn malos" en pruebas de personalidad o de capacidad.
En ocasiones, las personas que anticipan una acusacin criminal fingirn enfermedad
mental en pruebas de personalidad. Considrese el caso del cliente de psicoterapia
124
que contest una prueba de personalidad por instrucciones de su terapeuta. El

terapeuta deseaba una evaluacin precisa de la depresin aparentemente leve del
cliente. Los resultados fueron ambiguos, lo cual indica ya sea un grado monumental
de trastorno psicolgico o un intento consciente de exagerar los sntomas. Dos
semanas despus, el terapeuta descubre de manera inadvertida que el cliente est a
punto de ser acusado de abuso sexual infantil. En apariencia, haba falseado los resultados de prueba anticipando que pronto se haran cargos legales en su contra. En
parte, haba planeado defenderse aduciendo que la enfermedad mental era un factor
atenuante para su conducta.
En la mayora de los casos, un psicmetra bien entrenado puede detectar el
falseamiento consciente al hacer dos preguntas: 1) El cliente tiene motivacin para
tener un desempeo engaoso en las pruebas? 2) El patrn general de resultados es
sospechoso a la luz de otra informacin conocida del cliente? Si la respuesta para
ambas preguntas es s entonces el examinador har bien en ser escptico con los
resultados de la prueba.
Captulo 5. Pruebas de Personalidad

Leccin 21. Medicin de la personalidad
En algunos aspectos, medir la personalidad, se asemeja mucho a evaluar la
inteligencia, En uno u otro caso se intenta cuantificar algo que no podemos ver ni
tocar, y en ambos casos una buena prueba ha de ser confiable y valida a la vez.
Al evaluar la personalidad, no nos interesa la mejor conducta, lo que queremos
averiguar es la conducta tpica del sujeto, es decir, como suele comportarse en
situaciones ordinarias.
En la intrincada tarea de medir la personalidad los psiclogos recurren a cuatro
125
instrumentos
bsicos: la
entrevista personal, la
observacin
directa
del
comportamiento, los test objetivos y los test proyectivos.
La historia de la evaluacin de la personalidad puede caracterizarse por dos

tendencias superpuestas. Primero, las tcnicas proyectivas desestructuradas, como la
prueba Rorschach, dominaron las pruebas de personalidad a inicios del siglo XX y
despus perdieron su popularidad. En segundo lugar, los enfoques estructurados
como los inventarios de autoinforme y las clasificaciones conductuales obtuvieron
importancia a mediados del siglo y luego aumentaron rpidamente su popularidad. Las
tcnicas proyectivas
son resplandecientes en cuanto a las hiptesis que dan por
resultado sin embargo, las tcnicas proyectivas carecen en gran medida de la

aprobacin de los clnicos con orientacin psicomtrica. Los mtodos ms objetivos
para la evaluacin de la persona los favorecen los psiclogos con una mentalidad
dirigida a la medicin con instrumentos de respuesta de cierto/ falso y de eleccin
forzosa, incluyendo la prueba de personalidad de ms amplio uso, el Inventario
multifsico de la personalidad (MMPI) y su revisin ms reciente, el MMPI-2.
Los psicmetras contemporneos han dependido de tres tcticas para el desarrollo de
las pruebas: los enfoques ligados a la teora, las estrategias analtico-factoriales y los
mtodos con codificacin de criterio. Por supuesto, las fronteras son un tanto
artificiales y muchos de los autores de pruebas utilizan una combinacin de mtodos.
Cada vez que un psiclogo se enfrenta a la difcil tarea de medir la personalidad de un
individuo, asumen un reto ya que la personalidad es algo que ellos no pueden ni ver ni
tocar, pero que saben que est presente en cada una de las persona, y tratar de ver
como es la personalidad de un individuo en particular no es tarea fcil para los
mismos.
Para ilustrar esta temtica veremos cuatro instrumentos, dos de carcter objetivo y
dos proyectivo.
126
Leccin 22. 16 PF
FICHA TCNICA
Nombre original:
"Sixteen Personality Factor Questionnaire (16 PF)". Institute for
Personality and Ability Testing, Champaign, Illinois, U.S.A.

Autor:
R.B. Cattell.
Nombre en la Adaptacin Espaola: Cuestionario de Personalidad 16 PF.
Adaptacin Espaola: Seccin de Estudios de TEA Ediciones, S.A. Madrid, 1.975.
Administracin: Individual y Colectiva.
Duracin:
Variable, 45 a 60 minutos.
Aplicacin:
Adolescentes y Adultos, con un nivel cultural equivalente al de la

Enseanza Media para las Formas A Y B.
Significacin: Apreciacin de diecisis rasgos de primer orden y cuatro de segundo

orden de la personalidad; posible medida de la distorsin motivacional en las
Formas A, C y D, y de la Negacin en la Forma A.
Material: Manual, Cuadernillos, Hojas de respuestas y plantillas de correccin.
El Cuestionario de Personalidad de 16 Factores es un instrumento de valoracin
127
objetiva, elaborado mediante investigacin psicolgica con el fin de ofrecer en el

menor tiempo posible una visin muy completa de la personalidad.
El 16 PF se diseo para ser aplicado a sujetos de 16 aos en adelante y existen en

uso o en preparacin, seis formas diferentes; la C y la D estn destinadas a sujetos
con formacin medio-baja; la A y la B para personas con nivel de formacin igual o
superior al de bachillerato superior. Las restantes formas del cuestionario E y F, estn
proyectadas para sujetos que presentan algn dficit en su formacin y nivel de
comprensin lectora.
La visin global de la personalidad que intenta el 16 PF se basa en la evaluacin de
16 dimensiones funcionalmente independientes y psicolgicamente significativas,
aisladas y definidas repetidamente durante ms de treinta aos de investigaciones
factoriales, en grupos de sujetos normales y clnicos.
Los rasgos de personalidad evaluados por el 16 PF no estn nicamente aislados y

definidos por el Cuestionario, sino que se encuadran dentro del contexto de una teora
general de la personalidad; la primera publicacin comercial de la prueba (1949) fue
precedida de una fase de cerca de diez aos de investigacin emprica factorial.
Las dimensiones del 16 PF se especifican y definen brevemente ms adelante; los

factores, identificados por letras, se describen en sus dos polos o extremos
mediante una denominacin tcnica y unos cuantos adjetivos de uso corriente.
Adems de los 16 factores primarios mencionados, el cuestionario puede evaluar ocho

dimensiones secundarias que, como se indica posteriormente, son rasgos ms
amplios, obtenidos a partir de los factores primarios.
128
INSTRUCCIONES PARA LA APLICACIN
Las contestaciones se recogen en una Hoja de respuestas separada, nunca sobre el

mismo Cuadernillo. En primer lugar se le pide al sujeto que anote los datos de
identificacin (apellidos, nombre, edad, etc.), en la parte superior de la Hoja de
Respuestas. A continuacin se le indica que lea, a la vez que lo hace el examinador
en voz alta, las instrucciones de la portada del Cuadernillo y conteste en la Hoja a los
cuatro ejemplos que se proponen.
En ocasiones es preferible leer y discutir con el sujeto ciertos puntos de las
instrucciones, aunque el examinador debe ser siempre juez crtico en cualquier
situacin particular.
Para contestar en la Hoja y sealar sus respuestas, el sujeto debe colocar la Hoja
de forma apaisada; el espacio dedicado a los cuatro ejemplos de entrenamiento se
encuentran en la parte superior, fuera del recuadro dedicado a los elementos, y stos
estn dispuestos en forma de columnas, una para cada pgina del Cuadernillo.
Es probable que ayude al examinado conocer este diseo intencional en columnas, de

modo que al final de cada columna y pgina tenga un control de que viene
contestando a cada elemento en el lugar correspondiente.
Aunque el Cuestionario no tiene un tiempo limitado, es preferible recordarles que

no deben entretenerse demasiado en cada cuestin, sino contestar de un modo
natural, sincero y rpido.
Terminada la aplicacin se recoge la Hoja de respuestas y el Cuadernillo,

comprobando si se han anotado bien los datos de identificacin y si se ha dado una y
slo una respuesta a cada cuestin.
129
NORMAS PARA LA CORRECCIN Y PUNTUACIN
Las hojas de respuestas pueden ser corregidas manualmente. Cada respuesta puede
recibir 2, 1 0 puntos, excepto en el factor B (Inteligencia), cuyas contestaciones
reciben 1 0 puntos. La puntuacin de cada elemento contribuye slo a un factor o
escala (excepto en DM de la Forma A).
La utilizacin de la plantilla, preparada al efecto, facilita la correccin manual; en

ella se pueden obtener las puntuaciones directas en los 16 factores. Basta
colocarla sobre la hoja de respuestas de modo que por los espacios transparentes de
referencia - en la parte izquierda y fuera del recuadro dedicado a las contestaciones aparezcan las estrellas superior e inferior de la hoja.
Cada una de las escalas ocupa en la plantilla una zona aproximadamente

horizontal, separada por lneas y claramente diferenciadas. La puntuacin directa
de cada escala se puede hallar comenzando por la izquierda y sumando los puntos
obtenidos por las contestaciones del sujeto que aparezcan a travs de los espacios
transparentes; al terminar en el margen derecho de la plantilla, se anota el
resultado en la casilla existente en el margen derecho de la hoja de respuestas.
FIABILIDAD
La consistencia de las 16 escalas, puede mostrarse de muy diferentes modos. El
primer tipo de consistencia es la fiabilidad o concordancia de los resultados a travs
del tiempo. La fiabilidad puede, a su vez, subdividirse en:
a. Coeficiente de permanencia o correlacin test-retest en dos ocasiones distintas

separadas por un pequeo intervalo de tiempo;
130
b. Coeficiente de estabilidad o correlacin test-retest con un intervalo de tiempo

ms largo.
En diferentes aplicaciones de 16PF de diversas formas o diversas combinaciones

se ha encontrado coeficientes de permanencia entre 0,70 y 0,90 aproximadamente.
En todos los casos, el retest se realizo dentro de la semana siguiente a la primera
aplicacin. En otras aplicaciones, igualmente se han encontrado coeficientes de
estabilidad del orden del 0,71 y 0,88 con muestras de 132 personas y con un intervalo
de tiempo de 2 meses. Los coeficientes de estabilidad ms bajos se presentan
en aplicaciones test-retest con intervalos de 4 aos con valores entre
0,41 y 0,64.
VALIDEZ
El concepto de validez exige la eleccin de los elementos que sean buenas

medidas de los factores de personalidad tal como estos factores son definidos por los
estudios de investigacin. Este concepto de validez de las escalas puede evaluarse
directamente correlacionando las puntuaciones directas con los factores puros. En
aplicaciones de diversas formas de PF16 se ha encontrado que la validez es mayor
cuando se combinan las Formas y los ndices son relativamente elevados,
incluso en las escalas que contienen menos elementos.
El concepto de validez tambin puede evaluarse indirectamente determinando en qu

grado las correlaciones obtenidas entre las escalas del 16 PF y un grupo
representativo de variables psicolgicas diversas, estn de acuerdo con aquellas que
se esperara obtener a partir de los criterios conceptuales o factores puros. Para
ello, en una aplicacin de las formas A, B, C y D a 606 varones y mujeres se encontr
coeficientes de validez entre 0.90 y 0,96.
131
En ambas estimaciones de la validez, directa e indirecta, se encuentra gran

congruencia. En ambos estudios los ndices ms elevados son obtenidos por las
escalas A y F, y los ms bajos por las escalas M, N, O y Q1.
NORMAS INTERPRETATIVAS
CONVERSIN DE PUNTUACIONES DIRECTAS EN DECATIPOS
El significado de las puntuaciones directas de una forma o combinacin de formas del

16 PF depende, naturalmente, de la forma o formas utilizadas.
Consecuentemente, antes de que las puntuaciones directas puedan ser evaluadas e
interpretadas, deben convertirse a una escala comn y nica que site la puntuacin
del sujeto (adolescentes, universitario o de la poblacin general adulta) en relacin
con las obtenidas por un grupo normativo y definido de la poblacin. Las tablas
construidas en la tipificacin permiten la conversin de las puntuaciones directas en
otras denominadas decatipos, una escala tpica de diez puntos que ha mostrado en
la prctica un grado bastante bueno, en la discriminacin de los resultados.
Los decatipos se distribuyen sobre una escala de diez puntos equidistantes en

unidades tpicas (supuesta la distribucin normal), con una media en el decatipo
5,50 y una desviacin de 2 decatipos. As, pues, los decatipos 5 y 6 se extienden,
respectivamente, a media desviacin tpica a ambos lados de la media, y comprenden
el grupo central de la poblacin, mientras que los extremos superior del decatipo 10
e inferior del decatipo 1 se encuentran a dos y media desviaciones tpicas a ambos
lados de la media.
Se puede, por tanto, considerar que los decatipos 5 y 6 son valores medios, 4 y 7
132
muestran una pequea desviacin (en una y otra direccin, respectivamente), 2-3 y
8-9 indican una gran desviacin, y 1 y 10 son valores extremos, entendiendo todas
estas posiciones como relativas a la poblacin especfica sobre la cual se realiz la
tipificacin.
La seleccin del baremo adecuado permite obtener los decatipos correspondientes a

las puntuaciones directas alcanzadas por cualquier sujeto en las 16 escalas. Las
tablas cubren, para cada una de las formas del cuestionario, las poblaciones
adolescentes y adultos de uno y otro sexo. Para su elaboracin, se han conjugado los
criterios de significacin estadstica y de utilizacin prctica. El Psiclogo debe elegir
aquel baremo que mejor se ajuste a los sujetos examinados y a la finalidad de su
estudio.
INTERPRETACIN
Cada uno de los factores primarios evaluados por el 16 PF tiene una denominacin
alfabtica (desde A a Q) y un 4 nombre tcnico. La definicin e interpretacin de
los mismos, tal como se presenta en los prrafos siguientes, es breve, no tcnica y,
naturalmente, menos exacta que la descripcin critica y ms profunda que presenta el
"Handbook" u otras obras similares; si el Psiclogo desea profundizar ms en el
significado y operatividad de los factores debera examinar los numerosos perfiles
estudiados en el "Handbook" para grupos clnicos o profesionales bien definidos.
En las siguientes descripciones interpretativas de las puntuaciones bajas (decatipos

1-3) y altas (decatipos 8-10) el nombre tcnico se incluye entre parntesis;
previamente se da una breve definicin menos tcnica, con varios adjetivos
descriptivos que suelen utilizarse frecuentemente en la prctica.
133
FACTOR A
PUNTUACIONES BAJAS (1-3)

Reservada, alejada, crtica, fra.
(Sizotimia)
La persona que punta bajo tiende a ser dura, fra, escptica y a mantenerse alejada.
Le gustan ms las cosas que las personas, trabajar en solitario y evitar las opiniones
comprometidas. Suele ser precisa y rgida en su manera de hacer las cosas y en sus
criterios personales, rasgos que son deseables en muchas ocupaciones. En ocasiones
puede ser crtica, obstaculizadora e inflexible.
PUNTUACIONES ALTAS (8-10)
Abierta, afectuosa, reposada, participativa.

(Afectotimia)
La persona que punta alto tiende a ser afable, reposada, emocionalmente expresiva
(de aqu el polo de afectotimia), dispuesta a cooperar, solcita con los dems,
bondadosa, amable y adaptable. Le gustan las ocupaciones que exijan contactos con
la gente y las situaciones de relacin social. Fcilmente forma parte de grupos activos,
es generosa en sus relaciones personales, poco temerosa de las crticas y bastante
capaz de recordar los nombres de las personas.
FACTOR B
PUNTUACIONES BAJAS (1-3) Inteligencia
134
baja, pensamiento concreto.

(Poca capacidad mental para los estudios)
La persona que punta bajo tiende a ser lenta para aprender y captar las cosas; corta
e inclinada a interpretaciones concretas y literales. Su cortedad puede ser debida a
una escasa capacidad intelectual o a la influencia de factores psicopatolgicos que
limitan su actuacin.
Inteligencia alta, pensamiento abstracto, brillante.

(Mucha capacidad mental para los estudios).
La persona que punta alto tiende a ser rpida en su comprensin y aprendizaje de

las ideas. Existe alguna relacin con el nivel cultural y con la viveza mental. En una
situacin de diagnstico psicopatolgico, estas puntuaciones altas contraindican la
existencia de un deterioro mental.
FACTOR C
Afectada por los sentimientos, poco estable emocionalmente, turbable.

(Poca fuerza del ego)
La persona que punta bajo tiende a presentar poca tolerancia a la frustracin; cuando
las condiciones no son satisfactorias es voluble, plstica, evade las necesidades y
135
llamadas de la realidad, neurticamente fatigada, displicente, de emocin y turbacin

fcil, activa cuando se encuentra insatisfecha; presenta sntomas neurticos (fobias,
alteraciones del sueo, quejas psicosomticas, etc). Estas puntuaciones bajas son
comunes a casi todas las formas de alteraciones neurticas y a algunas psicticas.
Emocionalmente estable, tranquila, madura, afronta la realidad.

(Mucha fuerza del ego)
La persona que punta alto tiende a ser emocionalmente madura, estable, realista
acerca de la vida, tranquila, con buena firmeza interior y capacidad para mantener una
slida moral de grupo. A veces puede presentar ajustes conformistas en el caso
de problemas no resueltos.
FACTOR E
Sumisa, dbil, acomodaticia, conformista.

(Sumisin)
La persona que punta bajo tiende a ceder ante los dems, a ser dcil, y a
conformarse. Es, a menudo, dependiente, acepta las ideas de los otros, y se
muestra ansiosa por una exactitud obsesiva. Esta pasividad es parte de muchos
sndromes neurticos.
136
Dominante, independiente, agresiva, competitiva, obstinada.

(Dominancia)
La persona que punta alto es dogmtica, segura de s misma, de mentalidad

independiente. Tiende a ser austera, autoreguladora, hostil y extrapunitiva, autoritaria
(en el manejo de los dems), y a hacer caso omiso de toda autoridad.
FACTOR F
Sobria, prudente, seria, taciturna.

(Desurgencia)
La persona que punta bajo tiende a ser reprimida, reticente, introspectiva. A veces
es terca, pesimista, indebidamente cauta; es considerada por los dems como
presumida y estiradamente correcta. Suele ser una persona sobria y digna de
confianza.
Descuidada (confiada a la buena ventura), animada e impulsiva, entusiasta.

(Surgencia)
La persona que punta alto tiende a ser jovial, activa, charlatana, franca, expresiva,
acalorada y descuidada. Frecuentemente se le escoge como lder electo. Puede ser
impulsiva y de actividad imprevisible o cambiante.
137
FACTOR G

Despreocupada, evita las normas, acepta pocas obligaciones.
(Poca fuerza del superego)
La persona que punta bajo suele ser inestable en sus propsitos. Sus acciones
son casuales y faltas de atencin a los compromisos del grupo y las exigencias
culturales. Su alejamiento de la influencia del grupo puede llevarle a actos
antisociales, lo cual le hace ser ms efectiva, a la vez que su negativa de sujecin a
las normas le permite tener menos conflictos somticos en situaciones de tensin.
Escrupulosa (consciente), perseverante, sensata, sujeta a normas.

(Mucha fuerza del superego)
La persona que punta alto tiende a ser de carcter exigente, dominada por el
sentido del deber, perseverante, responsable, organizada, y 'no malgasta un
minuto'. Normalmente es escrupulosa y moralista. Ms que a tipos graciosos
prefiere como compaeros a personas trabajadoras. Hay que distinguir el ntimo
'imperativo categrico' de este superego esencial (en el sentido sicoanaltico), del
'yo social ideal' del Q3 aparentemente similar.
FACTOR H

Cohibida, reprimida, tmida, falta de confianza en s misma.
(Trectia)
138
La persona que punta bajo suele ser tmida, alejada, cautelosa, retrada, que
permanece al margen de la actividad social. Puede presentar sentimientos de
inferioridad. Tiende a ser lenta y torpe al hablar y expresarse, no le gustan las
ocupaciones con contactos personales. Ms que un grupo amplio, prefiere uno o
dos amigos ntimos, y no es dada a mantenerse en contacto con todo lo que est
ocurriendo a su alrededor.

Emprendedora, socialmente atrevida, espontnea, no inhibida
(Parmia)
La persona que punta alto tiende a ser sociable, atrevida, dispuesta a intentar nuevas
cosas, espontnea, de numerosas respuestas emocionales. Su indiferencia (falta de
vergenza) le permite soportar sin fatiga el 'toma y daca' del trato con la gente y
situaciones
las
emocionales abrumadoras. Sin embargo, puede
despreocuparse por los detalles, e invertir mucho tiempo charlando. Tiende a ser
emprendedora y estar activamente interesada por el otro sexo.
FACTOR I
Sensibilidad dura, confiada en s misma, realista

(Harria)
La persona que punta bajo tiende a ser prctica, realista, varonil, independiente,
responsable y, a la vez, escptica de las elaboraciones culturales subjetivas. A veces
139
es inamovible, dura, cnica, pagada de s misma. Tiende a mantener el grupo

trabajando sobre unas bases prcticas, realistas y acertadas.
Sensibilidad blanda, dependiente, impresionable, superprotegida.

(Premsia)
La persona que punta alto suele dejarse afectar por los sentimientos, idealista,
soadora, artista, descontentadiza femenina. A veces solicita para s la atencin y
ayuda de los otros; es impaciente, dependiente, poco prctica. Le disgustan las
personas y profesiones rudas. Suele frenar la accin del grupo y turbar su moral
con actividades intiles e idealistas.
FACTOR L
Confiable, adaptable, no afectada por los celos o envidia, de trato fcil.

(Alaxia)
La persona que punta bajo suele no presentar tendencia a los celos o envidia; es
adaptable, animosa, no competitiva, interesada por los dems, buena colaboradora
del grupo.

Suspicaz, engreda, difcil de engaar.
(Protensin)
140
La persona que punta alto suele ser desconfiada y ambigua. A menudo se encuentra
complicada con su propio yo, le gusta opinar sobre s misma, y est interesada en la
vida mental ntima. Suele actuar con premeditacin, es despegada de los otros y
colabora deficientemente con el grupo.
NOTA: Este Factor no es necesariamente 'Paranoia'; de hecho, los datos de los

esquizofrnicos paranoicos no son tan claros como cabra esperar a partir de los
valores tpicos del Factor L.
FACTOR M
Prctica, cuidadosa, convencional, regulada por realidades externas, formal y

correcta.
(Praxernia)
La persona que punta bajo suele mostrarse ansiosa por hacer las cosas
correctamente, atenta a los problemas prcticos y sujeta a los dictados de lo que es
evidentemente posible. Se preocupa por los detalles, capaz de serenidad en
situaciones de emergencia, aunque a veces es poco imaginativa.
lmaginativa, centrada en sus necesidades ntimas, abstrada, despreocupada de los

asuntos prcticos.
(Autia)
141
La persona que punta alto tiende a ser poco convencional, despreocupada de lo

cotidiano, bohemia, motivada por si misma, creadora, imaginativa, preocupada por lo
'esencial' y despreocupada de las personas particulares y la realidad fsica. Sus
intereses, dirigidos hacia su intimidad, la llevan a veces a situaciones irreales, con
explosiones expresivas. Su individualidad le empuja a verse excluido de las
actividades del grupo.
FACTOR N
PUNTUACIONES BAJAS (1-3) Franca,

natural, sencilla, sentimental.
(Sencillez)
La persona que punta bajo suele ser sencilla, sentimental, llana, poco sofisticada. Se
le satisface fcilmente y se muestra contenta con lo que le acontece; es natural,
espontnea, poco refinada y torpe.

Astuta, calculadora, mundana, perspicaz.
(Astucia)
La persona que punta alto suele ser refinada, experimentada, mundana y astuta. A
menudo es 'cabeza dura' y analtica. Su enfoque es intelectual y poco
sentimental, aproximndose a las situaciones de una manera casi cnica.
142
FACTOR O
PUNTUACIONES BAJAS (1-3) Apacible,

segura de s, flexible, serena.
(Adecuacin imperturbable)
La persona que punta bajo tiende a ser plcida, de nimo invariable. Su confianza en
s misma y su capacidad para tratar con cosas es madura y poco ansiosa; es flexible
y segura, pero puede mostrarse insensible cuando el grupo no va de acuerdo
con ella, lo cual puede provocar antipatas y recelos.
Aprensiva, preocupada, depresiva, turbable.

(Tendencia a la culpabilidad)
La persona que punta alto suele ser depresiva, preocupada, llena de presagios e
ideas largamente gestadas. Ante las dificultades presenta tendencia infantil a la
ansiedad. En los grupos no se siente aceptada ni con libertad para actuar. Una
puntuacin alta es muy corriente en los grupos clnicos de todo tipo.
FACTOR Q1
Conservadora, respetuosa de las ideas establecidas, tolerante de los defectos

tradicionales.
143
(Conservadurismo)
La persona que punta bajo confa en lo que le han enseado a creer y acepta lo
'conocido y verdadero', a pesar de sus inconsistencias, aunque se le presente algo
que pudiera ser mejor. Es precavida y puntillosa con las nuevas ideas, tiende a
posponer u oponerse a los cambios, a seguir la lnea tradicional, a ser
conservadora en religin y poltica, y a despreocuparse de las ideas analticas e
'intelectuales'.
Analtico-critica, liberal, experimental, de ideas libres y pensamiento abierto.

(Radicalismo)
La persona que punta alto suele interesarse por cuestiones intelectuales y dudar
de los principios fundamentales. Es escptica y de espritu inquisitivo en las ideas,
sean tradicionales o nuevas. Suele estar bien informada, poco inclinada a moralizar y
ms a preguntarse por la vida en general y a ser ms tolerante con las molestias y el
cambio.
FACTOR Q2
Dependiente, buena compaera y de fcil unin al grupo.

(Adhesin al grupo)
La persona que punta bajo prefiere trabajar y tomar decisiones con los dems, le
144
gusta y depende de la aprobacin social. Tiende a seguir las directrices del grupo,
incluso mostrando falta de decisiones personales. No es necesariamente gregaria
por decisin propia, sino que necesita del apoyo del grupo.

Autosuficiente, prefiere sus propias decisiones, llena de recursos.
(Autosuficiencia)
La persona que punta alto es temperamentalmente independiente, acostumbrada a

seguir su propio camino; toma sus decisiones y acta por su cuenta. No tiene en
consideracin la opinin del grupo, aunque no es necesariamente dominante en
sus relaciones con los dems. No le disgusta la gente, simplemente no necesita de su
asentimiento y apoyo.
FACTOR Q3
Autoconflictiva,
despreocupada
de
protocolos,
orientada por
sus
propias
necesidades.
(Baja integracin)
La persona que punta bajo no est preocupada por aceptar y ceirse a las
exigencias sociales. No es excesivamente considerada, cuidadosa o esmerada.
Puede sentirse desajustada, y muchas de sus desadaptaciones (especialmente las
afectivas, pero no las paranoicas) puntan en esta direccin de la variable.
145
Controlada, socialmente adaptada, llevada por su propia imagen.

(Mucho control de su autoimagen)
La persona que punta alto suele tener mucho control de sus emociones y
conducta en general, y ser cuidadosa y abierta a lo social; evidencia lo que
comnmente se llama 'respeto hacia s misma'; tiene en cuenta la reputacin social.
No obstante, a veces tiende a ser obstinada. Los lderes eficaces y algunos
paranoicos puntan alto en Q3.
FACTOR Q4
Relajada, tranquila, aletargada, no frustrada.
(Poca tensin rgica)

La persona que punta bajo suele ser sosegada, relajada, tranquila y satisfecha (no
frustrada). En algunas situaciones, su estado de mucha satisfaccin le puede llevar a
la pereza y al bajo rendimiento, en el sentido de que no tiene motivacin para intentar
algo (como un alto nivel de tensin rgica puede desbaratar tambin el rendimiento
escolar o Profesional).
Tensa, frustrada, presionada, sobreexcitada.

(Mucha tensin rgica)
La persona que punta alto suele ser tensa, excitable, intranquila, irritable e
impaciente. Est a menudo fatigada pero incapaz de permanecer inactiva. Dentro del
146
grupo tiene una pobre visin del grado de cohesin, del orden y del mando. Su
frustracin representa un exceso del impulso de estimulacin no descargada.
Leccin 23. MMPI

INVENTARIO MULTIFASICO DE LA PERSONALIDAD DE MINNESOTA (MMPI).
DESCRIPCIN GENERAL
FICHA TCNICA
Nombre:
Inventario Multifsico de la Personalidad de Minnesota.
Autores:
S. R. Hathaway y J. C. Mc Kinley.
Administracin:
Individual y Colectiva. Duracin:
Variable, de 45 a 60 minutos.
Aplicacin:
Sujetos cuyas edades oscilen entre 14 y 64 aos, con una
cultura equivalente a seis aos de escolaridad y saber leer con fluidez; los sujetos
no deben presentar alteraciones severas en su contacto con la realidad y limitaciones
en su dotaci6n intelectual.
Significacin:
Evala
las caractersticas
de personalidad, de
manera
multifsica puesto que intenta abarcar diversos aspectos de la persona mediante el

uso de 14 escalas; 4 de validez y 10 Clnicas.
ANTECEDENTES
147
Este inventario fue construido originalmente por el Psiclogo Starke Hathaway y el

Psiquiatra J.C. Mckinley; los primeros estudios sobre el tema aparecieron hacia
1.940. Posteriormente, en 1.943, la Universidad de Minnesota public el
cuestionario y, en 1.945, autoriz su publicacin a la Corporacin de Psicologa.
Los autores de la prueba pretendan que el MMPI fuera til para la evaluacin
diagnstica de rutina. A finales de la dcada de 1.930 y principios de 1.940, un
objetivo
primordial
Psiquiatra
para
el
Psiclogo
Clnico
y el
era asignar clasificaciones Psico-diagnsticas apropiadas a
casos individuales.
Desde su primera publicacin en 1.943, ha sido uno de los instrumentos de Psicoevaluacin ms objetivo y til tanto en la investigacin como en la prctica clnica
ya que su uso se facilita por la alta calidad interpretativa de sistemas actuariales
que ayudan en el proceso Clnico de elaboracin de decisiones.
Por otra parte para su elaboracin Hathaway y Mckinley, tuvieron en cuenta la

educacin y cultura de los sujetos a quienes se les administr, para que las frases
fueran comprendidas an por personas de bajo nivel intelectual.
En su elaboracin los autores utilizaron un enfoque de codificacin emprica en la

construccin de las diversas escalas del MMPI. Inicialmente se procedi a reunir
una gran cantidad de reactivos potenciales para el inventario, seleccionando una
amplia variedad de enunciados afirmativos de tipos de personalidad extrados de
fuentes tales como: historias de casos e informes Psicolgicos y Psiquitricos;
luego se seleccionaron grupos criterio apropiados y se procedi a elaborar las escalas
administrando los 504 reactivos originales a "Grupos Normales" y a "Grupos
Clnicos", realizando un anlisis de estos reactivos; poco tiempo despus se
148
elaboraron 2 escalas clnicas adicionales, primero la escala de MasculinidadFeminidad (MF) y la escala de introversin social (IS) desarrollada por Drake en
1.946.
ESTRUCTURA DEL INVENTARIO
El Inventario Multifsico de la Personalidad de Minnesota (MMPI) incluye 566

enunciados afirmativos de autoreferencia. La tarea de la persona que resuelve la
prueba consiste en dar respuesta a cada afirmacin como verdadera si se aplica a s
misma y como falsa si se considera que no es aplicable a s misma.
El contenido de los tems de este instrumento es muy variado. Estos dan

informacin sobre conductas exteriores, sentimientos que puedan observarse y
actitudes generales de tipo social; adems algunos tems intentan detectar "sntomas
morbosos", mientras que otros parecen no poseer ningn sentido favorable o
desfavorable.
DESCRIPCIN DE LAS ESCALAS
Como ya se ha visto el MMPI est formado por 14 escalas de validez: frases omitidas
(?), sinceridad (L), puntuacin de validez (F) y factor corrector (K); 10 escalas clnicas:
escala 1 (Hipocondriasis), escala 2 (Depresin), escala 3 (Histeria), escala 4
(Desviacin Psicoptica), escala 5 (Masculinidad-Feminidad), escala 6 (Paranoia),
escala 7 (Psicastenia), escala 8 (esquizofrenia), escala 9 (hipomana), escala 0 Si
(introversin o extroversin social).
ESCALAS DE VALIDACIN
149
ESCALA DE FRASES OMITIDAS (?)

Comprende todos aquellos elementos clasificados por el sujeto como NO SE o "No
puedo decir"; el valor de esta puntuacin afecta el significado de las dems
puntuaciones.
ESCALA DE SINCERIDAD (L)

Se construy con el fin de detectar un intento deliberado por parte del sujeto para
presentarse a s mismo de una manera favorable evaluando el grado de franqueza del
sujeto.
PUNTUACIN DE VALIDEZ (F)
Se desarroll para detectar formas desviadas de responder a los reactivos de la
prueba; puntuaciones altas indican el descontrol de las emociones, como tambin
indican sntomas del Neurtico y Psiquitrico.
FACTOR CORRECTOR (K)

Se elabor como un ndice de los intentos del examinado por negar su patologa y
presentarse a s mismo de una manera favorable o para aparecer de manera muy
desfavorable. Est integrada por 30 frases, es una escala de correccin para las
Escalas Clnicas: 1 (Hs), 4 (Dp), 7(Pf), 8 (Es) y 9 (Ma) y se relaciona con la actitud
defensiva ante la debilidad Psicolgica o exhibicionismo Psicolgico.
ESCALAS CLNICAS
Se encuentran subdivididas en tres zonas as:
l. - ZONA PSICONEUROTICA
Comprende las siguientes Escalas:
150
ESCALA 1 HS (Hipocondriasis o Somatizacin)

Se desarroll para identificar pacientes que manifestaran un patrn de sntomas
asociados con la clasificacin de hipocondra y/o Somatizacin localizada (se
caracteriza por una preocupacin anormal por las propias funciones corporales y
temores concomitantes a la enfermedad), Esta escala consta de 33 reactivos
asociados
con preocupaciones Somticas o con el funcionamiento fsico en general.
ESCALA 2 D (Depresin).
Se elabor con el propsito de evaluar el grado en que un sujeto puede presentar

depresin sintomtica caracterizada por pesimismo, falta de esperanza en el futuro e
insatisfaccin general con la propia situacin de vida. Esta escala consta de 60
reactivos que tratan diversos aspectos de la depresin (negacin de la felicidad y el
mrito personal, retardo psicomotor, ausencia de inters en lo que les rodea.
ESCALA 3 Hi (Histeria).
Se desarroll para identificar individuos que utilizaban reacciones histricas ante las
situaciones de tensin, adems de determinar Somatizacin no Localizada sin
determinacin de una causa real. Consta de 60 reactivos de dos tipos generales;
algunos tienen que ver con una negacin general de la Salud Fsica y una variedad de
quejas sintomticas algo ms especificas.
ZONA SOCIAL
Comprende las siguientes escalas:
ESCALA 4 Dp (Desviacin Psictica)
151
Se elabor con el fin de identificar personas asociales, antisociales, sociales y

disociales. Esta escala consta de 50 reactivos que cubren un amplio rango de
temas incluyendo falta de satisfaccin en la vida, problemas sexuales y dificultad
con la autoridad.
ESCALA 5 MF (Masculinidad- Feminidad)

Se desarroll para definir los intereses que son propios de hombres y mujeres;
adems de identificar la homosexualidad. Consta de 60 reactivos relacionados con
material sexual y diversidad de temas.
ZONA PSIQUIATRICA
Comprende las siguientes escalas:
ESCALA 6 PA (Paranoia)
Se elabor a fin de identificar pensamientos o ideas paranoides (sentimientos
de persecucin, ideas de grandeza, suspicacia, opiniones, actitudes rgidas, etc).
Consta de 40 a 60 reactivos relacionados con conductas Psicticas.
ESCALA 7 Pt (Psicastenia)
Se desarroll con el propsito de encontrar caractersticas de la personalidad
clasificada como Psicastenia (reacciones fbicas - obsesivo compulsivas y
excesivas dudas); sin embargo en la actualidad no es de uso comn. Esta escala
consta de 48 reactivos que cubren una variedad de sntomas y conductas
relacionadas con pensamientos obsesivos, sentimientos de temor y/o ansiedad y
dudas sobre la propia capacidad.
ESCALA 8 Es (Esquizofrenia)
Se elaboro para identificar individuos asociados con la esquizofrenia, aislamiento
152
emocional, las relaciones inadecuadas con las familias, apata e indiferencia. Esta
escala consta de 78 reactivos que cubren un amplio grupo de conductas; siendo la
ms amplia de todas las escalas clnicas.
ESCALA 9 Ma (Mana - Hipomana)

Se desarroll bsicamente para identificar estados de nimo de las personas con
caractersticas manaco depresivas, tipo manaco.
ESCALA O Si (Introversin - Extroversin Social)

Aunque esta escala se desarroll despus de las otras Escalas Clnicas, ha sido
tratada como estndar. Se dise para evaluar la tendencia de los sujetos a
aislarse de los contactos y responsabilidades sociales; adems de identificar aspectos
relacionados con la extroversin social. Consta de 70 reactivos de dos tipos
generales: un grupo se refiere a la participacin social, en tanto que el otro a una
inadaptacin neurtica general y autodesprecio.
MATERIAL DE LA PRUEBA
FORMA INDIVIDUAL
- Hoja de anotacin y perfil.

- 12 Plantillas de correccin.
FORMA COLECTIVA
- Cuadernillo con 566 reactivos.

- Hoja de respuestas y Perfil.
- Clave de correccin.
153
- 15 plantillas de correccin (incluyendo escalas adicionales).
ESCALAS ADICIONALES
Comprende las siguientes Escalas:
FUERZA DEL YO (Es)

La desarroll Barron (1.953), especficamente para predecir la respuesta de pacientes
neurticos a la Psicoterapia individual. Consta de 68 reactivos que hacen referencia al
funcionamiento fsico, aislamiento, actitudes hacia la religin, posicin moral,
adecuacin personal y habilidad para enfrentar fobias y ansiedades.
DEPENDENCIA (Dy)
La desarroll Navran (1.954), para evaluar la intensidad de las necesidades de
dependencia. Consta de 57 reactivos.
DOMINANCIA (Do)
La desarrollaron Gough, McClosky y Meehl (1.951); esta variable de la personalidad
puede ser importante en la psicologa de la participacin social. Consta de 28
reactivos que permiten detectar la iniciativa social, capacidad para el mando,
persistencia, acciones esforzadas, preocupacin e identificacin con la comunidad o
sociedad y sentimiento de la responsabilidad.
RESPONSABILIDAD (Re)
La desarrollaron los mismos autores de la Escala de Dominancia en 1.952. Consta de
32 reactivos los cuales se refieren a la preocupacin por temas sociales y morales,
desaprobacin de privilegios, nfasis en los deberes y la autodisciplina, seguridad
personal, etc. (Gough, 1.952).
154
CONTROL (Cn)
La desarroll Cuadra, (1.953) para estudiar el problema de la necesidad de
hospitalizacin. Consta de 50 reactivos que incluyen la conciencia de las propias
debilidades, sensibilidad a las crticas sociales, ciencias religiosas y participacin en
actividades riesgosas.
FUNDAMENTO ESTADSTICO
CONFIABILIDAD
En los cuestionarios de personalidad, la estimacin de este estadstico depende en

gran medida de que el grupo comprenda slo sujetos normales, incluya slo enfermos
Psiquitricos hospitalizados, o est formado por personas de ambos grupos. Es muy
probable que los rasgos de personalidad sean ms estables en los sujetos normales
que en los enfermos Psiquitricos; por esto teniendo en cuenta las dificultades
aludidas para una prueba como el MMPI, los datos que se citan a continuaci6n
parecen bastante satisfactorios.
Hathaway y Mc Kinley (1.942) y Mc Kinley y Hathaway (1.942, 1.944), han aplicado la

forma individual a un grupo de 47 sujetos normales no seleccionados, presentan
coeficientes de fiabilidad en seis de las variables bsicas; utilizando el
procedimiento de test-retest con un tiempo de intervalo entre tres das y ms de un
ao.
Cottle (1.950) obtiene coeficientes de confiabilidad test-retest aplicando la forma

individual y la forma colectiva en un grupo de 30 enfermos Psiquitricos no
seleccionados; Holaberg y Alessi (1.949), citan coeficientes de confiabilidad obtenidos
mediante la aplicacin de la forma individual completa y una versin reducida de la
155
misma.
VALIDEZ
El criterio de validez se obtuvo principalmente en la prediccin de casos clnicos; el

valor del pronstico del MMPI se hall comparando sus resultados con el
diagnstico final elaborado por Profesionales Neuropsiquitricos de los Centros
Clnicos. De esta manera, se ha observado que una puntuacin alta en una escala
predice positivamente el diagnstico clnico final del profesional, y discrimina en
ms de un 60% las nuevas admisiones de enfermos psiquitricos. Este porcentaje ha
sido obtenido en la diferenciacin entre varios tipos de casos clnicos.
INSTRUCCIONES PARA LA APLICACIN Y CORRECCIN
APLICACIN
Esta prueba puede administrarse con facilidad en forma individual o colectiva y
dicha aplicacin puede ser realizada por examinadores no profesionales
(familiarizados con todo el material presentado en el Manual); aunque necesita de
un clnico experimentado para su interpretacin. Adems la disponibilidad de diversas
formas bsicas asegura que puede administrarse a un amplio espectro de personas
de la manera ms conveniente para los sujetos y el examinador.
Las formas se encuentran disponibles para administraciones individuales, en grupo,

para individuos ciegos u otros que no pueden leer y formas abreviadas que siempre
conducen a una prdida de informacin.
Las instrucciones que deben darse al sujeto son las indicadas en la primera pgina del
cuadernillo forma colectiva.
156
Seisdedos y Cordero en el Manual publicado por TEA Ediciones, 1.986, afirman

que el MMPI debe ser presentado como una tarea seria e importante, brindando al
sujeto la seguridad de que las respuestas sern estudiadas en su propio beneficio. Si
se consigue esta actitud, se favorecer en gran medida la cooperacin de los
examinados; algunos pueden necesitar posteriores aclaraciones sobre el propsito
perseguido y el uso que van a tener los resultados. Si es posible, deben darse
respuestas sinceras, evitando eludir o desviar la responsabilidad.
CORRECCIN Y VALORACIN
Algunos autores afirman que en primer lugar, deben separarse las hojas de
respuestas segn el sexo de los examinados, y tambin borrar las respuestas que
tengan sealadas las dos contestaciones (V y F), que se considerarn como
respuestas NO SE.
Otros consideran que se realiza observando detalladamente la hoja de respuestas y

anotando el nmero de respuestas omitidas; luego se procede a contar
cuidadosamente el nmero de respuestas que caen dentro de las plantillas, anotando
las puntuaciones en bruto de las diferentes escalas; en caso de no tener disponibles
las plantillas se podr utilizar la clave de correccin.
Posteriormente se anotan las puntuaciones en bruto de las diferentes escalas con el

mayor cuidado convirtiendo esta puntuacin en Puntajes T que vienen relacionados en
la hoja del perfil arriba del nombre de la escala.
Por otra parte hay cinco escalas Clnicas que son modificadas por diversas
proporciones del valor en bruto obtenido por la Escala K. De esta forma, la escala
157
1Hs, deber ser incrementada en su puntaje en bruto, por el 0.5 (la mitad) del valor de
la Escala K en bruto.
Al puntaje en bruto de la Escala 4 Dp, se le agrega el 0.4 de K.
Al puntaje en bruto de la Escala 7 Pt, se le agregar el puntaje completo de K.
Al puntaje en bruto de la Escala 8 Es, se le agregar el puntaje completo de K y al

puntaje en bruto de la Escala 9 Ma, se le agregar el 0.2 de K.
Una vez modificados los puntajes de estas cinco escalas, se elabora el perfil,
ubicando cada puntaje en bruto en el nivel de su conversin correspondiente en
calificaciones T.
CODIFICACIN DEL PERFIL

Con respecto al MMPI se han utilizado dos sistemas de codificacin: el sistema
original de Hathaway (1.947) y un sistema ms completo desarrollado por Welsh
(1.948). En la actualidad existe una gran cantidad de material publicado en ambos
sistemas. A continuacin se describirn los pasos de cada uno de ellos:
- CDlGO DE WELSH
Paso 1.
Escribir los dgitos que representan las escalas ordenadas segn la cuanta de la
puntuacin T, de mayor a menor.
Paso 2.
Introducir los smbolos que indiquen la cuanta de los valores T (90 o mayor, 80 -89,
158
- 70 -79, - 60 - 69, -50 - 59,- 40 49, 30-39 # 29 o menor a la derecha de #) .
Paso 3.
Se pueden codificar las escalas de validacin y colocarlas separadamente a la
derecha del cdigo de las escalas clnicas.
- CODIGO DE HATHAWAY.
Paso 1.
Se registra el nmero de la Escala que tiene la mayor puntuacin T.
Paso 2.
Se anotan a continuacin de este nmero, y por orden descendente de las
puntuaciones T, los nmeros de las escalas que tengan valores superiores a 54.
Paso 3.
Insertar un apstrofe () despus del ltimo nmero de escala en la clave que tenga
una puntuacin T de 70 o ms.
Paso 4.
Se subrayan los nmeros de las escalas cuyos valores T sean iguales o se diferencien
en solo un punto.
Paso 5.
Utilizar un guin (-) y luego registrar el nmero de la escala menor en el perfil si dicha
escala tiene una puntuaci6n T menor que 46.
159
Paso 6.
Siga la misma regla para subrayar esas puntuaciones bajas como se indic en el paso
4 para puntuaciones altas.
Paso 7.
A la derecha y separada de las escalas clnicas, registre los puntajes crudos para L, F
y K en ese orden y separada por dos puntos (:). Si la puntuacin directa de L es igual
o mayor que 10, o si la F es igual o mayor que 16, se coloca un "X"; a fin de sugerir
que el perfil puede ser invlido.
INTERPRETACIN
A continuacin se presenta de manera breve algunos indicadores para la

interpretaci6n del MMPI, a fin de ser una gua didctica en dicha explicacin. Es
muy importante para la interpretacin del MMPI tener un conocimiento previo de las
caractersticas clnicas correspondientes a los nombres de las escalas; adems es
importante tener en cuenta las caractersticas cuantitativas del MMPI, que son las que
permitirn la organizacin de las escalas en el perfil; se podr observar, que se
utilizarn con frecuencia los trminos elevada o baja, para designar la ubicacin
general de cada escala dentro del perfil.
Cuando se hable de una Escala elevada se har referencia a que tiene un puntaje por
arriba de la media estadstica y, en comparacin con las dems, tiende a sobresalir.
Su puntaje es el ms alto o uno de los ms altos.
Se hablar de Escalas bajas, cuando el puntaje de la misma sea inferior a la media

estadstica o en comparacin con los dems, sea uno de los ms reducidos o el
ms reducido.
160
Otro aspecto importante al aplicar el MMPI es tener en cuenta la finalidad de la

aplicaci6n y las situaciones que la rodean. Para poder interpretar los perfiles del MMPI
en forma integral, se debe tomar en cuenta que en esta tcnica concurren dos
aspectos fundamentales: una parte cuantitativa y otra cualitativa.
La parte cuantitativa proporciona una informacin, tanto de la severidad con que un

rasgo se acenta en la personalidad (por la elevacin de cada escala), como de la
comparacin de las caractersticas de un sujeto con otros de su mismo grupo o de
otros grupos sociales.
El aspecto cualitativo del inventario debe ser entendido en base a los elementos
clnicos que proporcionan cada una de las escalas y de las combinaciones en que
se encuentran relacionadas; en este punto se debe tener en cuenta que todas las
escalas del perfil tienen relacin entre s, adems de la configuracin que se puede
observar con la clave.
Leccin 24. El Test de Rorschach

Se ha discutido desde hace algn tiempo la utilizacin de las pruebas proyectivas, ya
que no cumplen con los requisitos psicomtricos (confiabilidad, validez y
normas), por eso algunos autores opinan que no se les debe dar el titulo de
pruebas, sino utilizar uno menos comprometedor como el de tcnicas o mtodos
proyectivos de evaluacin. Levy en 1963 propuso llamarlas tcnicas de
provocacin de respuestas, ya que dependen de la habilidad del clnico para
hacer interpretaciones, otros ms estrictos, sugieren que se deben retirar del
arsenal de pruebas psicolgicas. Se abordan los argumentos a favor y en contra de
las pruebas proyectivas y su valor de uso como instrumentos propios del quehacer
161
psicolgico. Veamos aqu el test de Rorschach

El test de Rorschach es una tcnica y mtodo proyectivo de psicodiagnstico, creado
por el psicoanalista suizo Hermann Rorschach (1884-1922). Se public por vez
primera en 1921 y alcanz una amplia difusin.
El test consiste en una serie de lminas en las que encontramos manchas
aleatorias de tinta. El psicoterapeuta pide al sujeto que d sentido a esas manchas. A
partir de estas interpretaciones el psicoterapeuta intenta ver lo que sucede en la
mente del paciente.
El test de Rorschach es quizs el ms conocido de los test, debe su nombre al
psiquiatra suizo Hermann Rorschach (1884-1922).
Bsicamente es un test proyectivo aunque a partir de l se ha estudiado su
cuantificacin. Por lo que se lo considera una de las pruebas ms completas. Pero su
mayor logro es la amplia difusin que posee, ya que a partir de ella existe una
amplia cantidad de investigaciones y casustica. El material actual disponible es
inmenso.
El test de Rorschach consta de 10 lminas compuestas por manchas de tinta (negras
y policromticas) sobre un fondo blanco. Estas lminas poseen una morfologa vaga
por lo que resultan especialmente sugerentes. Las lminas son presentadas de
manera sucesiva a un paciente preguntndole lo que ve en ellas y como y donde
manifiesta lo observado. Esta basado en lo que las personas perciben, ya que
visualizan en las manchas diferentes aspectos. El anlisis del test est basado en lo
percibido. Para mencionar solo algunos pocos ejemplos que ilustran sobre las
caractersticas del test, cabe mencionar que interesa (entre otras cosas) la localizacin
de lo observado, su forma, si presenta movimientos (que tipos de movimientos) si se
perciben diferentes aspectos, si se perciben utilizando toda la lmina o parte de ella
162
(en que detalles de una lmina se visualizan los elementos), si lo observado tiene
dimensin, profundidad, color, reflejo, sombra, brillo, si se observan objetos
inanimados, humanos, animales, paisajes, el tipo de respuestas, etc. Sera
interminable describir la infinidad de respuestas posibles.
Varios caminos han tenido un desarrollo independiente. Los de mayor desarrollo y
difusin fueron los de Klopfer y Rapaport, tambin alcanzaron un importante desarrollo
las lecturas de Beck, Hertz y Piotrowsky entre otros. El nombre de John Exner merece
una mencin particular, integr las cinco principales corrientes en un nico Sistema
Comprensivo, y es en la actualidad la corriente de mayor desarrollo, difusin,
utilizacin y expansin en el mundo. A diferencia de los anteriores posee un enfoque
menos complicado en sus lecturas y desarrollos diagnsticos. Se presenta a si mismo
como un medio y no un fin, por lo que se promociona como un test para ser utilizado
en diferentes mbitos y por diferentes lecturas tericas.
Proporciona ms de cincuenta rasgos de la Personalidad estudiada, superando a
cualquier otra prueba. Del sujeto estudiado, nos habla entre otros rasgos de:
Inteligencia: Capacidad. Estilo. Fantasa. Complejidad. Ajuste. Distorsin.
Afectos: Inters. Formas de mostrarlos. Control. Influencia de las emociones en la

resolucin
de
problemas. Constriccin
de las
muestras
afectivas.
Oposicionismo.
Vivencialidad: Recursos psicolgicos disponibles. Modos de afrontamiento:

Reflexivo. Impulsivo. Ambigual. Activo o pasivo.
Autopercepcin:
Autoestima:
Egocentrismo,
narcisismo,
dependencia,
aislamiento. Preocupacin corporal.
Interrelaciones: Modelos de lo humano. Inters por los dems. Habilidad social.

Inters por lo convencional. Visin de las relaciones sociales bien como de
cooperacin o bien como agresivas.
Estrs: Nivel. Presiones que inciden en l
163
Tono de humor: Valoracin de las interacciones con el entorno. Nivel de

Depresin. Potencialidad suicida.
En la descripcin de la Personalidad, no slo se refiere a lo patolgico, sino

tambin a rasgos positivos en los que la terapia puede apoyarse o incluso
potenciarlos.
Con frecuencia descubre problemas que el propio sujeto ignoraba, hacindole
involucrarse ms en la terapia.
Libre del error de deseabilidad social, el Rorschach es insustituible cuando de la
evaluacin dependan consecuencias ajenas al mero diagnstico: Custodia de hijos,
puestos de trabajo, mejor trato por parte de la Justicia, etc.
Es ideal para la Seleccin de Personal de alta cualificacin, ya que, adems de lo
dicho, la rica informacin que proporciona sealar a los sujetos ms idneos para
desempear tareas concretas.
Requiere mayor nivel de conocimientos que otras pruebas. No solo sobre el propio
Rorschach sino tambin sobre Personalidad y Psicopatologa, solo as se logra
conseguir toda la amplitud de informacin que es capaz de proporcionar.
164
El Rorschach como test perceptivo

El test de Rorschach no es propiamente un test proyectivo, sino que naci como un
test perceptivo. Esto es, da cuenta de qu y cmo la persona ve el mundo; su
capacidad para resistir el estrs, su tendencia a la introversin o extroversin, si sufre
de algn tipo de problema emocional, la mucha o poca adecuacin a la realidad social,
etc.
Mtodos de interpretacin
Rorschach muri en 1922, a un ao de presentar su test. Esto, sumado a su
difusin un tanto tarda, llevo a que distintos psiclogos americanos y europeos
165
definieran sus propios mtodos de interpretacin del test. Los mtodos de mayor
renombre fueron los de Klopfer y Rapaport, junto a los de Beck, Hertz y Piotrowsky.
Con el tiempo, la diversidad de mtodos y la falta de un mtodo comn llevo al
desprestigio del test por su falta de confiabilidad; esto es, cada psiclogo tena su
propio mtodo y era casi imposible comparar resultados.
A inicios de los 70, la Fundacin Rorschach comenz una serie de estudios para
determinar cules eran los mtodos de tabulacin e interpretacin ms utilizados, para
despus iniciar una serie de investigaciones sobre aquellos indicadores que provean
de informacin clnica relevante. El resultado de estos esfuerzos es el ahora conocido
Mtodo Comprehensivo de Exner, editado por primera vez el ao
1974.
El mtodo comprehensivo de Exner
El mtodo comprehensivo de Exner es el resultado de las investigaciones iniciadas en
los
70
por la
Fundacin
Rorschach para generar un
mtodo
nico
de
codificacin, tabulacin e interpretacin del Rorschach. Cada una de las variables que
presenta el modelo cuenta con investigaciones empricas que respaldan su validez. En
estos momentos, es el estndar de facto para la aplicacin e interpretacin del
Rorschach y, segn la experiencia del autor, da resultados bastante vlidos.
Si bien las propiedades psicomtricas del test de Rorschach son limitadas, el
procedimiento se est fortaleciendo en tanto los sistemas de codificacin se hacen
ms especficos y los investigadores dedican ms atencin a la comprobacin
emprica de sus conceptos. La validez de la interpretacin puede mejorar con el uso
frecuente de la tcnica y con la mayor experiencia clnica.
Para complementar informacin sobre este test, recomendamos ver las siguientes
pginas:
166
www.rorschach.org
http://www.serymp.org
Leccin 25. Casa rbol Persona (H-T-P)
La H-T-P es una prueba proyectiva que utiliza dibujos a pulso de una casa, un rbol y
una persona (Buck, 1948, 1981). A la persona examinada se le da casi completa
libertad de trazar los tres objetos, se piden dibujos a lpiz y a colores por separado.
Aunque el examinador puede improvisar una prueba H-T-P con meras hojas de papel
en blanco, Buck (1981) recomienda el uso de una forma de dibujo con cuatro hojas
que tiene en la primera pgina la informacin de identificacin. Las pginas 2, 3 y 4
tienen como ttulo Casa, rbol y Persona. Se necesitan dos formatos de dibujo para
cada examinando, uno para los dibujos a lpiz y el otro para los dibujos a color. Buck
(1981) tambin proporciona un formato independiente de cuatro hojas para una fase
de interrogatorio posterior a los dibujos que consiste de 60 preguntas diseadas para
obtener las opiniones de la persona examinada en cuanto a los elementos de los
dibujos. Muchos profesionales consideran que la fase de interrogatorio no amerita un
esfuerzo adicional. Tambin se cuestiona el valor de los dibujos realizados con
colores (Killian, 1987).
La Tcnica Proyectiva del Dibujo de casa-rbol-persona tiene en mucho la misma
herencia que la Prueba del Dibujo de la Figura Humana. Como la Prueba DFH, la HT-P se concibi en un principio como una medida de inteligencia, completa con un
sistema de calificacin cuantitativa para estimar un nivel aproximado de capacidad
(Buck, 1948). Sin embargo, los clnicos pronto abandonaron el empleo de la H-T-P
corno medida de inteligencia y ahora se le utiliza casi de manera exclusiva como
medida proyectiva de la personalidad.
Aunque no se ahondar en los detalles, la interpretacin de la H-T-P depende de tres
suposiciones generales: el dibujo de la Casa refleja la vida hogarea y las relaciones
167
intrafamiliares de la persona examinada, el del rbol refleja la manera en que el

individuo experimenta el ambiente y el de la Persona hace eco de sus relaciones
interpersonales. Buck (1981) proporciona numerosas hiptesis interpretativas tanto
para los aspectos cuantitativos como cualitativos de los tres dibujos.
La H-T-P es una atractiva prueba que ha fascinado a los clnicos por ms de 40
aos. Por desgracia, Buck (1948, 1981) nunca ha proporcionado algn tipo de
evidencia que sustente la confiabilidad o validez de este instrumento. De hecho,
quizs l mismo es su peor crtico. En cierto punto dentro de su manual de la prueba,
incluso llega a afirmar que la investigacin sobre validacin no es posible con la H-TP (Buck, 1981, p. 164). Entre los impedimentos para dicha investigacin cita los
siguientes elementos:
1. Ningn signo en s mismo es indicacin infalible de alguna fortaleza o
debilidad en el individuo.
2. Ningn signo en la H-T-P tiene un solo significado.
3. La importancia de un signo puede diferir notablemente de una constelacin a
otra.
4. La cantidad de datos diagnsticos y pronsticos que pueden obtenerse de
cada uno de los puntos de anlisis puede variar en gran medida de una
persona a otra.
5. Los colores no tienen algn significado absoluto y universal.
6. Ninguno de los elementos del sistema de calificacin cuantitativa puede
tomarse automticamente por su valor aparente
Captulo 6. Pruebas de Inteligencia y otras pruebas de las funciones cognitivas

En la medicin de estas capacidades con test de inteligencia nos encontramos con
un gran problema derivado del hecho de que la expresin de las mismas est muy
influenciada por el momento en que se realizan.
168
El cansancio, el estado de humor y otros mltiples factores pueden afectar

significativamente su expresin de un da a otro o entre el comienzo y el final de un
mismo da.
El segundo gran problema es que cada medicin concreta utiliza un test de
inteligencia especfico y particular y que los resultados pueden variar en gran
medida en funcin de si el individuo ha realizado un test de inteligencia similar en el
pasado o por la mayor o menor simpata o afinidad cultural con el mismo, aunque si
est bien diseados este aspecto debera ser bastante reducido.
Una conclusin sencilla sera el pensar que estas capacidades no son estables a
lo largo de la vida y que se encuentran muy influenciadas por el medio ambiente.
Sin embargo, algunos expertos opinan que existe una gran estabilidad de las
capacidades a lo largo de la vida, especialmente a partir de los 6 aos.
Por su parte, el lenguaje, como expresin del inconsciente colectivo, claramente
opina que la inteligencia es una cualidad fija puesto que utiliza el verbo ser y no el
verbo estar en expresiones como "Esa persona es muy inteligente".
Para ilustrar la relacin entre el desarrollo de la comprensin de la inteligencia y la
medicin psicolgica, ilustraremos la temtica a partir de la prueba WISC-R
Leccin 26. WISC - R, escala de inteligencia de Wechsler para nios - revisada
CARACTERSTICAS
Versin revisada, modificada y actualizada del WISC. El WISC-R mantiene un gran

nmero de elementos del WISC tradicional, sustituyendo o eliminando los que
169
resultaban obsoletos y aadiendo otros, en ciertas pruebas, para aumentar su

fiabilidad; se ha modificado el orden de aplicacin a fin de que sea ms ameno para
el nio.
Algunas pruebas amplan sus instrucciones con nuevos ejemplos, evitando as

posibles ambigedades y garantizando que el nio comprenda la naturaleza de la
tarea que ha de realizar.
Aplicacin: Individual.
Tiempo: Aproximadamente 1 hora y 30 minutos.

Edad: De 6 a 16 aos.
Juego completo con 25 cuadernos de anotacin y material manipulativo.

En la escala del WISC-R se incluyen las siguientes pruebas:
Escala verbal: Informacin. Semejanzas. Aritmtica. Comprensin
Escala de ejecucin: Figuras Incompletas. Ordenacin de Dibujos. Diseos con
Cubos.
Un buen ejemplo de su uso lo encontrar en el artculo anexo: Estructura factorial

de la Escala de Inteligencia para Nios de Wechsler-Revisada (WISC-R). Un
acercamiento desde el mbito clnico
(http://www.cop.es/delegaci/andocci/VOL.%2019_3_6.pdf)
170
Leccin 27. Medicin rpida de habilidad intelectual - BARSIT
Con el BARSIT se obtiene rpidamente un ndice de la aptitud para aprender, mediante

la valorizacin de factores de inteligencia verbal y razonamiento numrico, haciendo
tambin intervenir elementos cognoscitivos lgico-verbales y de informacin general.
El BARSIT es una prueba que puede emplearse colectivamente y utiliza material
impreso (papel y lpiz). Es de fcil aplicacin y se recomienda como prueba inicial.
El BARSIT tiene un doble uso:
a.
Para escolares a partir de la terminacin del 3er.
Grado (Psicologa Educativa)

b.
Para adultos con educacin primaria (Psicologa
del Trabajo y Educativa)

Propsitos
1.
Determinar rpidamente el nivel de inteligencia
o aptitud para aprender.

2.
Comparar la composicin de grupos. Si se usa con
este fin, se obtiene una apreciacin de la distribucin del grupo y se puede comparar la
composicin de dicho grupo con sus afines.
3.
Seleccionar previamente casos excepcionales. Al
aplicar el BARSIT a grupos, se pueden escoger

los individuos que hayan alcanzado resultados superiores
o inferiores para el estudio detallado de tales casos
extremos - supra o subnormales - y aplicarles reactivos
adecuados.
4.
Adaptabilidad del sujeto. El BARSIT como prueba
inicial sirve de adiestramiento para aquellos individuos

que no hayan tenido anteriormente ocasin de realizar
171
pruebas o tests. Este primer contacto con una prueba,

relativamente sencilla, establece una "empata" entre el sujeto y las sucesivas pruebas,
y los resultados sern orientadores para determinar la aplicacin de otros tests.
Descripcin de la prueba
La prueba est impresa en un pliego de cuatro pginas y a dos colores: negro y azul.
La primera pgina contiene los datos de identificacin del sujeto, las instrucciones y
diez ejemplos que deben ser resueltos con la ayuda del examinador. En las tres
pginas restantes figuran sesenta tems o cuestiones escalonadas experimentalmente
con arreglo a la dificultad intrnseca1 que presentan y mezclan progresivamente los
cinco tipos de preguntas o reactivos que se van formulando:
1.
Informacin o conocimientos generales.
2.
Comprensin de vocabulario mediante el conocimiento
de opuestos.
3.
Razonamiento verbal, discriminando la palabra que
expresa un concepto diferente a otras cuatro que

mantienen entre s una semejanza de categora.
4.
Razonamiento lgico mediante la asociacin a un
elemento dado del anlogo, de acuerdo con otra

asociacin conocida.
5.
Razonamiento numrico mediante series de nmeros
que deben completarse, una vez deducida la regla

que rige a cada serie.
A excepcin de las series numricas, los otros cuatro tipos de preguntas se formulan
por el sistema de seleccin mltiple. En este caso el sujeto no debe escribir ninguna
palabra, limitndose a subrayar la respuesta seleccionada como adecuada a la
172
cuestin que se le presenta.
APLICACIN Y CALIFICACIN
Instrucciones previas a la aplicacin de la prueba

1 El examinador debe tener un conocimiento cabal de la prueba y debe haberse
familiarizado con las instrucciones de este Manual antes de aplicarla por primera vez.
2 No es necesaria una especial preparacin psicolgica para aplicar el BARSIT, pero
el examinador debe poseer las condiciones necesarias para dirigir el grupo.
3 Los sujetos que vayan a efectuar el test deben poder trabajar en condiciones
favorables: saln apropiado con mesas adecuadas (distanciadas para evitar copias),
buena iluminacin y ventilacin.
4 Deben disponer de lpices y ejemplares impresos del BARSIT, uno para cada
sujeto; adems de algunos lpices de reserva para utilizarlos en casos de emergencia.
5 Un solo examinador difcilmente podr atender grupos mayores de veinticinco

examinandos. En caso de tener que aplicar en una sesin la prueba a un grupo
numeroso - disponindose de local amplio y adecuado - el examinador debe obtener la
colaboracin de auxiliares.
6 Los auxiliares deben haber sido previamente instruidos. Sus funciones sern:
distribuir y recoger los ejemplares, evitar copias, y hacer que los examinandos sigan
estrictamente las instrucciones de la parte de la prueba que estn efectuando.
En el caso de producirse alguna rotura de la punta de un lpiz, el auxiliar deber
suministrar inmediatamente otro (nunca debe emplearse tiempo en sacar una nueva
punta).
173
En ningn caso los auxiliares intervendrn positiva o negativamente en los

trabajos de los que efectan la prueba. No deben ni siquiera comprobar cmo son
los resultados, abstenindose de todo acto o movimiento de aprobacin o
desaprobacin.
El sujeto no debe sentirse cohibido por esta comprobacin, ni tampoco
estimulado.
Cmo debe aplicarse el BARSIT
Una vez que estn convenientemente sentados los examinandos se proceder a
entregar a cada uno un lpiz y un ejemplar de la prueba.
Cuando se distribuyan los formularios se colocarn stos delante del individuo,
de manera que tengan a la vista solamente la pgina en donde aparecen las
instrucciones.
Al efectuar dicha distribucin, nunca deben ser colocadas las hojas al revs.
El examinador debe explicar brevemente lo que se espera, diciendo: "Ustedes
van a realizar una prueba sencilla y muchas de las cuestiones que se les preguntan
son bastante fciles. Deben procurar responder el mayor nmero posible de
cuestiones para demostrar la cantidad de trabajo que son capaces de hacer en
poco tiempo".
(Cuando los examinandos tengan instruccin superior a la primaria, podrn abreviarse
las siguientes instrucciones. Despus de la lectura que ellos mismos hayan hecho, el
examinador se limitar a cerciorarse de que han sido comprendidas las
instrucciones.)
Para comenzar dir:
174
"Escriban con letra clara sus apellidos y sus nombres dentro del cuadro que hay
en la parte superior de la pgina que tienen a la vista, despus la edad y la
fecha del da en que se efecta la prueba".
Terminados de anotar estos datos, el aplicador de la prueba leer en voz alta
las instrucciones que figuran en la primera pgina al mismo tiempo que lo hacen por
su cuenta los sujetos que realizan la prueba.
Es conveniente que el aplicador lea en forma muy clara y no pase a una
cuestin nueva sin asegurarse que todos estn siguiendo y comprendiendo lo
que se est leyndoles.
Al terminar de leer cada uno de los ejemplos, debe preguntar a alguno de los
que se examinan, para que ste d la respuesta y explique qu debe hacerse.
De todos modos, el examinador debe dictar la respuesta correcta.
Es conveniente insistir hasta estar seguro de que las instrucciones, y
especialmente la forma en que deben ir poniendo las soluciones, han sido bien
comprendidas.
El aplicador de la prueba les dir:
"No deben escribir ninguna palabra, y solamente subrayar una de las cinco
palabras que se encuentran despus de la pregunta y que sea la que mejor conteste
a ella".
(Cuando sea necesario, explicar que subrayar quiere decir poner una raya por
debajo.)
Al llegar a los ejemplos 5 y 10, les dir:
175
"Cuando ustedes encuentren series de nmeros como stas, deben tratar de

encontrar cules son los dos nmeros que faltan y escribirlos en los espacios
punteados".
Si las series han sido ledas con cierta entonacin, haciendo una marcada
pausa al llegar a los espacios punteados, el sujeto descubrir fcilmente los
nmeros que faltan. En el caso de que no lo comprenda, se le ayudar dndole las
explicaciones necesarias.
Despus les repetir:
"Cuando encuentren series de nmeros deben escribir los dos nmeros que faltan
para llenar los espacios punteados".
Es necesario comprobar que todos han comprendido bien estas instrucciones
y han resuelto los diez ejemplos correctamente.
Por ltimo el aplicador leer las seis lneas que figuran al pie de la pgina en donde
se les recomienda que trabajen con rapidez, pero que procuren no cometer
errores y que no se distraigan mirando lo que hacen los dems.
Se les preguntar si tienen alguna duda, y en el caso de que alguien formule alguna
pregunta, sta ser aclarada, pero una vez dada la orden de comenzar no deben darse
nuevas explicaciones. Antes de dar la orden de que pueden empezar les dir:
"Van a disponer de diez minutos para contestar el mayor nmero de preguntas
posible"."Hay tres pginas por llenar y deben trabajar sin distraerse".
Llegado este momento se procurar atraer la atencin de todos y se dar la
orden:
"Vuelvan la pgina. Comiencen por la pgina dos y contesten las cuestiones
que all encuentren! "No se entretengan! Empiecen!
176
Tiempo de ejecucin
Se otorgan diez minutos. El tiempo se comienza a contar a partir del momento de dar
la orden: "Empiecen", o sea despus de finalizadas las instrucciones de la primera
pgina. Transcurridos exactamente diez minutos despus de dada la orden de
"empiecen", se dir "ALTO! Dejen los lpices de encima de la mesa", y el aplicador,
ayudado por los auxiliares, recoger las pruebas. Esta operacin de recoger los
formularios debe hacerse muy rpidamente.
Calificacin
Para calificar el BARSIT, se revisarn las contestaciones dadas, de acuerdo con la
clave de correccin, y a cada cuestin bien resuelta se otorga un punto. (En la
parte superior de la clave, encima de cada columna de respuestas se destaca un
nmero que corresponde a la pgina del test. Si se hacen coincidir ambos nmeros,
la operacin de corregir las pruebas es sumamente fcil.)
Se considera la respuesta como incorrecta si se ha subrayado ms de una palabra, y
si en las series numricas solamente aparece bien uno de los dos nmeros que se
deben escribir, tambin se conceptuar como incorrecta.
Una vez calificada la prueba se anotarn los puntos obtenidos en la casilla
correspondiente de la primera pgina, y se le asignar la centila que le pertenece,
de acuerdo con la Tabla de normotipos.
INTERPRETACIN Y DATOS ESTADSTICOS

Cmo han sido obtenidos los normotipos
Con el BARSIT se han realizado aplicaciones en Argentina, Colombia, Uruguay y
Venezuela, y actualmente se estn efectuando nuevos experimentos en otras
repblicas americanas.
177
Las tablas que figuran en esta primera edicin del manual corresponden a los
resultados obtenidos con sujetos venezolanos.
Para establecer las normas correspondientes a
los escolares, se acumularon por separado las puntuaciones alcanzadas por
estudiantes de diferentes regiones del pas (varones y nias), que hubieren cursado
o estuvieren terminando tercero, cuarto, quinto o sexto grado de instruccin
primaria. (La educacin primaria en Venezuela alcanza hasta el 6 grado.) Se ha excluido
intencionalmente los datos de escolares de edades anormales en relacin con el
grado.
Patrocinaron
las
investigaciones
el
Laboratorio
de
Psicologa
Aplicada
(Psicotecnia) de la Escuela Normal M.A.C.; los servicios de Psicologa Aplicada de

los Liceos "Fermn Toro" y "Aplicacin"; la Seccin de Psicopedagoga del Instituto
Pedaggico, y el Instituto de Psicologa y Psicologa Aplicada (Psicotecnia) de la
Facultad de Filosofa y Letras de la Universidad Central de Venezuela.
Todas las aplicaciones del BARSIT se llevaron a cabo durante el primero o
ltimo mes de cada ao escolar, dirigidas por el propio autor, y realizadas con la
colaboracin de estudiantes seleccionados de los cursos de Mediciones y
evaluacin psicopedaggica.
Para establecer las normas de personas adultas,
representativas de la poblacin trabajadora venezolana, se han reunido las
puntuaciones de individuos comprendidos entre las edades de veinte a treinta aos. Se
han distribuido en tres grupos de acuerdo con el nivel de instruccin:
1. Primaria completa (sexto grado)
2. Casi completa (cuarto o quinto grados)
3. Incompleta (hasta tercer grado)
178
Los datos proceden de diferentes regiones del pas, y han sido facilitados por
diversas industrias que han adoptado el BARSIT como prueba preliminar de preempleo
o para fines de entrenamiento, y en proporcin muy considerable por los servicios
de seleccin que dirige el Dr. Pedro Snchez Landaeta.
Cmo usar los normotipos
El generalizado sistema de las centilas o rangos percentilares se utiliza en los normotipos
venezolanos (en este Manual se publican los revisados en Diciembre de 1956, vase
Cuadro n 1).
Del mismo modo que cuartila o decila expresa un valor estadstico que indica
cuartas partes o dcimas partes del total de un grupo, la centila seala las
centsimas partes del grupo a que nos referimos. Una centila siempre indica la
porcin que est por debajo, por lo cual puede utilizarse como una medida de
ordenacin o posicin.
As por ejemplo, a un adulto con instruccin primaria completa, que haya obtenido
42 puntos con el BARSIT, de acuerdo con los normotipos le corresponde la
centila 66.
Este valor significa que si comparamos dicha puntuacin con los resultados
de adultos de su mismo nivel, 66% de individuos quedan igual o por debajo de
l, y por tanto solamente 34% pueden alcanzar una puntuacin superior a la
que l ha obtenido.
Otro ejemplo: A un escolar de 12 aos, que haya cursado el 5 grado y solamente
conteste bien 30 cuestiones o tems del BARSIT, de acuerdo con las Escalas de los
normotipos de 5 grado, a 30 puntos le corresponde la centila 10.
Comparndose esta puntuacin con lo que es normal en su grupo,
solamente 10% de escolares de su mismo nivel de instruccin obtienen
179
resultados iguales o inferiores, y por tanto cabe esperar que 90% alcancen
resultados superiores a 30 puntos.
Cuadro 1
Test rpido Barranquilla - normotipos
venezolanos
CENTILAS
CENTILAS
Escolares de nueve
PUNTOS
a catorce
GRADOSaos
SEXTO
QUINTO
CUARTO
Trabajadores adultos de 20 a
30 aos
CON INSTRUCCIN PRIMARIA DE

TERCERO
60
59
58
57
56
55
6 GRADO
5 0 4
o MENOS
99
90
59
58
57
56
55
98
97
96
54
53
52
51
99
98
50
49
48
47
46
97
95
93
91
87
99
98
96
99
45
82
95
98
44
43
42
41
75
69
61
54
92
89
85
81
97
96
95
93
40
39
38
37
36
35
46
39
31
25
19
13
74
68
61
53
47
39
3433
32
31
9
7
5
3
30
29
28
27
26
PUNTOS
9 o 10a
95
94
93
91
99
54
53
52
51
98
97
89
87
85
82
80
96
76
91
98
73
70
66
62
89
88
86
84
91
88
85
81
76
71
97
96
95
94
93
91
58
54
50
46
42
38
82
80
77
74
71
69
96
95
94
93
92
91
40
39
38
37
36
35
32
25
20
15
65
60
54
48
89
87
84
81
34
30
27
23
65
62
59
55
89
87
85
82
34
33
32
31
10
42
78
20
52
80
30
8
5
4
2
37
31
26
21
75
71
67
63
17
15
12
10
48
45
42
39
77
74
71
69
29
28
27
26
17
59
35
65
25
13
10
8
6
55
50
45
41
7
6
5
4
32
29
26
23
62
58
54
51
24
23
22
21
4
3
2
37
33
29
25
21
20
18
16
14
12
48
45
41
37
34
20
19
18
17
16
25
24
23
22
21
20
19
18
17
16
99
2
1
95
94
92
99
50
49
48
47
46
45
98
97
44
43
42
41
15
19
10
31
15
14
13
12
11
16
13
11
9
9
8
7
6
28
25
22
19
14
13
12
11
12-14a
180
10
11-13a
9
8
7
6
17
10
6
5
4
3
15
13
9
8
11
9
7
6
4
3
<N
4
3
2
1
'
1
1
1012
7
6
5
4
4
3
2
1
N de casos
498
309
387
316
930
997
650
N de casos
Media
Desviacin
40.4
36.5
31.4
38.0
5.2
5.4
6.8
23.0
9.2
29.4
11.9
20.6
11.4
Media
Desviacin
9.9
Cmo interpretar los resultados cualitativamente

Cuando se desee una rpida interpretacin cualitativa de los puntos obtenidos con
el BARSIT, basada en cinco categoras: Excelente, Superior, Mediano, Inferior y Muy
inferior, de acuerdo con el nivel de instruccin, se puede usar la escala valorativa,
segn el Cuadro n 2.
Cuadro 2
Interpretacin cualitativa segn la
puntuacin obtenida con el BARSIT
MUY INFERIOR 10%
INFERIOR 20%
MEDIANO
40%
SUPERIOR
EXCELENTE 10%
20%
ESCOLARES
Sexto grado
Quinto grado
Cuarto grado
Tercer grado
hasta 34
hasta 30
hasta 23
hasta 11
de 35 a 37 de
31 a 33 de 24
a 27 de 12a
18
de 38 a 43 de
34 a 39 de 28
a 34 de 19 a
27
de 44 a 46 de
40 a 43 de 35
a 39 de 28 a
34
ms de 46
ms de 43
ms de 39
ms de 34
Sexto grado 4 o 5
grado Hasta Ser.
grado
hasta 26
hasta 15
hasta 6
de 27 a 33 de
16 a 23 de 7
a 14
de 34 a 43 de
24 a 35 de 15
a 26
de 44 a 50 de
36 a 44 de 27
a 34
ms de 50
ms de 44
ms de 34
Validez
181
Conseguimos puntuaciones de calificaciones escolares. Con ello intentbamos

obtener criterios externos que nos permitieran calcular el grado de conexin
entre los rendimientos de la prueba y las notas escolares.
Al lado de resultados alentadores: r - + 716; otros eran de r = + .446.
El diagrama n 1 muestra la relacin que existe entre el xito en los estudios y las
puntuaciones del BARSIT. (Datos procedentes del Colegio San Jos, Barranquilla,
noviembre 1944, cuarto ao, B. N = 26, X = 31, DE = 6.8)
Ms estudios de validez
Los alumnos del curso de Mediciones y evaluacin del Instituto Pedaggico Nacional
(Cursos para Directores, 1947-48), recopilaron nuevos datos de los resultados del
BARSIT y las calificaciones escolares alcanzadas por los estudiantes de los terceros
grados de las Escuelas Pblicas de Caracas. Se tomaron 267 muestras (X = 23, DE
= 9). El coeficiente de validez que se obtuvo fue de + .457.
Confiabilidad
Un primer intento para calcular coeficientes de confiabilidad se llev a cabo
repitiendo la aplicacin de la prueba al mismo grupo, transcurridas unas
semanas de la primera aplicacin, y el resultado de este coeficiente de
constancia fue de r = + .91. (Liceo de Aplicacin, Caracas, octubre-noviembre
de 1948.) La falta de otras pruebas tipificadas no nos permiti calcular
coeficientes de equivalencia.
INFORMACIN COMPLEMENTARIA ACERCA DEL BARSIT
Es comn en los manuales de pruebas ofrecer las referencias necesarias de la informacin
bibliogrfica. En esta edicin tenemos que suplir la falta de trabajos publicados sobre el
BARSIT, por el acopio de datos que han quedado inditos. La bibliografa sobre pruebas
182
en espaol es relativamente escasa. Tenemos conocimiento de trabajos cientficos

llevados a cabo en Argentina, Colombia, Costa Rica, Cuba, Chile, Ecuador, Espaa,
Guatemala, Mxico, Panam, Per, Puerto Rico, Uruguay y Venezuela. Pero la falta
de comunicacin entre los profesionales y la poca difusin de las ediciones circunscribe
la aplicacin de los resultados y la utilizacin de los mismos.
Historia del BARSIT
En el ao 1940, en Barranquilla, Colombia se cre un Instituto de Psicologa
Aplicada (Instituto Psicotcnico), como ampliacin del Laboratorio de Psicologa
Experimental del Colegio de Barranquilla, "destinado a la investigacin y estudio, desde
el punto de vista del rendimiento y bienestar de los alumnos. . . tendiendo a
determinar el nivel mental, y tipo predominante de su inteligencia. . ." (Revista del Museo
del Atlntico, Publicacin Bimestral, Director Julio Enrique Blanco, Barranquilla,
Repblica de Colombia, Nmero preliminar octubre de 1941.
Durante ms de un lustro se recopilaron datos que pudieran ser utilizados para
la fijacin de estndares o normotipos. Fruto de ello es el "Informe de la labor
realizada durante los aos 1940, 1941, 1942, 1943 y 1944 por Francisco del Olmo
Barrios", (Suplemento a los Nos. 8 y 9 de la Revista del Museo del Atlntico, marzo de
1945), y (Franziska Baumgarten: "Progress of Psychotechnique" I. 1939-1945 Bern. La Psychotechnique en Colombia, por Mercedes Rodrigo, pgina 115).
Entre las 32 pruebas adoptadas por el Instituto de Barranquilla (pgina 46, del informe
citado), se experiment el "Rapid Survey Intelligence Test" de Rudolf Pintner,
previamente traducido con autorizacin personal del autor.
Los resultados de ese experimento demostraron que no se poda utilizar en
nuestro medio. Surgan marcadas dificultades, especialmente en cuanto a la
adaptacin a los lmites de tiempo para efectuar los diferentes tipos de ejercicios.
El tiempo de tres minutos para cada una de las cuatro partes de que consta la
183
prueba result demasiado breve para los sujetos examinados, ya que no estaban
habituados a realizar pruebas calculadas para tiempos cortos. Adems presenta un
segundo inconveniente a los aplicadores de las pruebas, pues las instrucciones se
deben impartir por separado, pgina por pgina, siendo esto un obstculo al tener que
mantener una estrecha vigilancia para evitar que se intente comenzar a resolver partes
del test mientras se dan las instrucciones. Durante los aos 1943 y 1944, se estudi
una nueva prueba que llenara un cometido similar a la del Dr. Pintner, pero evitando los
inconvenientes de los tiempos parciales. Se crearon nuevos tems para medir el
vocabulario, el razonamiento verbal y otros para el razonamiento lgico; para medir el
razonamiento numrico se organizaron series adecuadas, y adems se introdujeron
nuevos tems de informacin general, factor que ha demostrado su validez en pruebas
de otros autores (Terman, Wechsler, etctera). Terminadas las experiencias en 1945
se trataron estadsticamente los resultados.
Se haban examinado los siguientes escolares: De 13 aos: 1003; de 12 aos:
462; de 11 aos: 338; de 10 aos: 252; de 9 aos: 108.
Calculados los resultados con esta muestra de 951 varones y 1202 nias que
estaban terminando el ao escolar en escuelas oficiales y colegios privados, se
obtuvieron los siguientes datos:
Segundo ao N = 565 X= 19 46 DE = 8.37 Tercer ao N = 785 X= 28 99
DE = 7.57 Cu a rt o a o N = 8 0 3 X = 3 4 2 1 DE = 6 . 6 7 (La instruccin
primaria en Colombia finalizaba en esa poca al 4 ao.)
184
Cuestionario
AHORA EMPIEZAN A CONTAR LOS DIEZ MINUTOS
1. El queso se fabrica de:
las flores,
la harina,
la leche,
las uvas,
el azcar
2. Lo contrario de abierto es:
liso,
cerrado,
delante,
claro,
despejado
3. De estas cinco palabras una pertenece a una clase diferente. Cul es ?
rojo,
amarillo,
morado,
bandera,
verde
malla,
ladra
4. El pjaro canta, y el perro:

habla,
rebuzna,
cacarea,
5. Escriba los dos nmeros que faltan a esta serie:
10
15
20
25
35
40
45
55
6. Para medir la temperatura se emplea el:
litro,
gramo,
termmetro,
metro,
kilovatio
despierto,
claridad
7. Lo contrario de dormido es:
noche,
luz,
amanecer,
8. De estas cinco palabras una pertenece a una clase diferente. Cul es?
agua,
platino,
caf",
t,
cerveza
9. El zapato protege al pie, y el sombrero protege a:
la cabeza,
la mano,
el dedo,
el brazo,
la rodilla
12
...........
18
21
11. El tringulo es una figura formada por:
24
............
30
185
4 lados,
6 lados,
5 lados,
3 lados,
9 lados
12. Lo contrario de negro es:
oscuro,
sombra,
opaco,
sucio,
blanco
Pedro,
Enrique,
Ana,
Jos,
Carlos
14. El naranjo es un rbol, y el perro es:
un objeto,
un animal,
una cosa,
un mineral,
un vegetal
11
13
...........
17 ............
21
23
16. El gato es un:

insecto,
mamfero,
ave,
pez,
reptil
17. Lo contrario de triste es:
alegre,
preocupado,
dolorido,
desgraciado,
enfermo
Bogot,
Lima,
Alpes,
Caracas,
Quito
19. La piel cubre al hombre, y las plumas cubren a:
la vaca,
el perro,
el gato,
la gallina,
el caballo
14
21
28
42
49
21. Treinta es el triple de:
quince,
tres,
22. Lo contrario de calor es:
diez,
doce,
cinco
63
70
186
sudor,
fatiga,
blanco,
fro,
luz
cuchara,
plato,
tenedor,
cuchillo,
cucharita
24. Para coser se emplea la aguja, y para dibujar se emplea el:
lpiz,
bastn,
tintero,
pie,
ojo
40
36
32
28
20
16
12
26. La Cordillera de los Andes est en:

Europa,
Asia,
Amrica,
Australia,
frica
27. Lo contrario de arriba es:
dentro,
abajo,
cerca,
completo,
lejos
General,
Teniente,
Capitn,
Presidente,
Coronel
29. Con el cuero se fabrica el calzado, y con la tela:
piel,
lana,
algodn,
seda,
vestidos
64
58
52
46
..........
34
28
...........
16
10
31. Roma es la capital de:
Nicaragua,
Espaa,
Grecia,
Italia,
Paraguay
32. Lo contrario de s es:
antes,
afirmar,
duda,
luego,
no
vaso,
copa,
agua,
jarra,
taza
187
34. La nariz sirve para oler, y los ojos sirven para:
or,
ver,
gustar,
tocar,
andar
10
20
80
160
640
1280
36. El idioma oficial de Hait es el:
ingls,
francs,
espaol,
holands,
portugus
37. Lo contrario de despacio es:
de prisa,
lento,
pausado,
dbil,
grueso
carpintero,
herrero,
mdico,
albail,
zapatero
39. Al lunes sigue el martes, y a enero sigue:

junio,
viernes,
mes,
febrero,
ao
16
32
128
256
41. Fernando de Magallanes fue un famoso:

militar,
aviador,
navegante,
sabio,
sacerdote
42. Lo contarlo de blando es:

suave,
duro,
liso,
grueso,
dbil
ver,
or,
oler,
andar,
gustar
44. El codo articula el brazo, y la rodilla articula:
188
el corazn,
los dedos,
los pulmones,
el cerebro,
la pierna

5
11
15
20
33
41
60
46. Cristbal Coln descubri Amrica en el:

siglo XIII,
siglo XVII,
siglo IV,
siglo XV,
siglo XIV
47. Lo contarlo de fuera es:

libre,
lejos,
distinto,
malo,
dentro
Venus,
Jpiter,
Satlite,
Urano,
Neptuno
49. Octubre es anterior a noviembre, y jueves es anterior a:

diciembre,
viernes,
septiembre,
mircoles,
da

90
80
71
63
50
45 ..................... 38
36
35
51. Los primeros ferrocarriles empezaron a funcionar hacia:

1900,
1800,
1825,
1750,
1710
52. Lo contarlo de empezar es:

iniciar,
adelantar,
obstruir,
terminar,
buscar
feliz,
triste,
satisfecho,
alegre,
contento
54. La paz viene despus de la guerra, y la calma viene despus de:

la tormenta,
el crepsculo,
el bienestar,
la felicidad,
el ocaso

120
100
82
66
40
30 ......................
16
12
10
189
56. La bitcora es de uso indispensable en:

msica,
biologa,
navegacin,
teatro,
qumica
57. Lo contarlo de homogneo es:

compacto,
heterogneo,
abstracto,
sutil,
neutro
Stravinski,
Bach,
Mozart,
Newton,
Chopin
59. La biblioteca es para guardar libros, y la pinacoteca para guardar:

peridicos,
discos,
pelculas,
monedas,
cuadros

6561
2187
729
81 9
190
191
Leccin 28. Test de aptitudes diferenciales (DAT)

El DAT se public inicialmente en 1947 para proporcionar una base paia la orientacin
educativa y vocacional de los alumnos de bachillerato. Despus, los examinadores
encontraron que esta prueba es til en la orientacin vocacional de jvenes adultos que
se encuentran fuera de la escuela y en la seleccin de empleados. La prueba ha tenido
revisiones peridicas y es una de las bateras de prueba de aptitudes mltiples ms
popular de todos los tiempos (Bennett, Seashore y Wesman, 1982, 1984).
Razonamiento Verbal (RV), Razonamiento Numrico (RN), Razonamiento Abstracto
(RA), Velocidad y Precisin Perceptual (VPP), Razonamiento Mecnico (RM),
Relaciones Espaciales (RE), Ortografa (O), Uso del lenguaje (UL).
Los autores eligieron las reas para las ocho pruebas con base en datos
experimentales y experienciales, ms que en un anlisis factorial formal realizado por
ellos mismos. En la construccin del DAT, los autores se guiaron por varios criterios
explcitos:
Cada prueba debe ser independiente: existen situaciones en las que se requiere
o se desea slo una parte de la batera.
Las pruebas deben medir poder: para la mayor parte de los propsitos
vocacionales a los que contribuyen los resultados de una prueba, la evaluacin
del poder resolver problemas difciles en el tiempo adecuado es de inters
primordial.
La batera de prueba debe producir un perfil: las ocho calificaciones
independientes puede convertirse en rangos percentiles y representarse en una
grfica comn de perfil.
Las normas deben ser adecuadas: en la quinta edicin, las normas se obtuvieron
de 100 000 estudiantes para la estandarizacin de otoo y 70 000 para la de
primavera.
Los materiales de prueba deben ser prcticos: con lmites de tiempo de 6 a 30
192
minutos por prueba, el DAT completo puede aplicarse en una sesin escolar
matutina o vespertina.
Las pruebas deberan ser fciles de aplicar: cada una contiene excelentes
ejemplos de "calentamiento" y las pueden aplicar personas con un mnimo de
entrenamiento especial.
Deben estar disponibles formas alternas: con propsitos de repeticin de prueba,
la disponibilidad de formas alternas (en la actualidad formas C y D) reducir
cualesquier efecto de la prctica.
La confiabilidad del DAT es, por lo general, bastante alta, con coeficientes por mitades
que en gran medida se localizan en el rango de .90 y confiabilidades de formas alternas
que se encuentran en el rango de .73 a .90, con mediana de .83. Razonamiento
mecnico es una excepcin, con confiabilidades tan bajas como .70 en el caso de las
nias. Las pruebas muestran un patrn mixto de intercorrelaciones, que los autores
interpretan de manera optimista como una confirmacin de la independencia de las
ocho pruebas. En realidad, muchas de las correlaciones son bastante altas y parece
probable que las ocho pruebas reflejen un menor nmero de factores de capacidad.
Con toda seguridad, las pruebas de Razonamiento Verbal y Capacidad numrica miden
un solo factor slido, con correlaciones alrededor de .70 en diversas muestras.
El manual presenta amplios datos que demuestran que las pruebas del DAT, en
especial la combinacin RV + RN, constituyen buenos medios de prediccin de las
calificaciones en educacin media superior y universidad (correlaciones en los rangos
de .60 y .70). Por tal razn, la combinacin de RV + RN se considera con frecuencia
como un ndice de la aptitud escolar. La evidencia de la validez diferencial de las otras
pruebas es bastante limitada.
Aun as, el DAT revisado es mejor que las ediciones anteriores. Una mejora importante
es la eliminacin del aparente sesgo de gnero en las pruebas de Uso del Lenguaje y
Razonamiento Mecnico una fuente de crticas en ediciones anteriores. Los editores
de la Quinta Edicin llevaron a cabo un cuidadoso estudio sobre sesgo de gnero, raza,
193
tnico y regional, a fin de eliminar los reactivos que podran ser estereotpicos u
ofensivos para subgrupos identificables.
Lo que es ms, realizaron anlisis estadsticos complejos para eliminar reactivos de
dificultad desigual entre subgrupos raciales equiparados en trminos de desempeo
general.
Ejemplo de reactivo
RELACIONES ESPACIALES
Cul de las figuras de la derecha se puede hacer al doblar el patrn a la izquierda? El patrn siempre representa la parte externa de la figura.
Leccin 29. Test gestltico visomotor de Bender

Ms all de cualquier duda, la prueba de dibujo de ms amplia utilizacin es el Test
Gestltico Visomotor, conocido de manera ms comn como Prueba Gestalt de Bender
(BGT, Bender, 1938). La BGT consta de nueve figuras estmulo (figura 9-9); se instruye
a la persona evaluada para que copie cada figura en una hoja de papel en blanco. Se
dice al examinando que la BGT: "... no es una prueba de capacidad artstica, pero
intente copiar el dibujo lo ms precisamente posible. Trabaje con la rapidez o lentitud
que usted desee" (Huit, 1977).
Se han diseado vanos sistemas de calificacin para determinar si el desempeo de
una' persona es el ms comn en individuos con dao' cerebral o sin l (Hain, 1964;
Hutt y Briskin, ' 1960; Lacks, 1999; Pascal y Suttell, 1951;" Pauker, 1976). En el caso
de adultos, el mejor de estos enfoques de calificacin se encuentra en Lacks (1999).
Esta autora identific 12 signos cualitativos que se califican segn presencia contra
ausencia en el protocolo completo. La presencia de cualesquiera de los cinco signos
indica dao cerebral (cuadro 9 -11). Con: base en la confirmacin independiente de
194
otras fuentes de informacin, Lacks resea tasas de' xito de 82 a 86% en una muestra
combinada de admisiones a la unidad de tratamiento psiquitrico agudo de un centro
urbano de salud mental comunitaria (Lacks y Newport, 1980). En Gregory (1999) se
analizan diversas variaciones interesantes en la BGT. Grolh-Marnat |;{1990) dedica un
captulo completo a este instrumento, incluyendo pautas interpretativas para nios y
adultos.
A.
1.
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
o
2.
3.
4.
Resumen de signos diagnsticos en el Test Guestltico Visomotor

1.
Rotacin: la figura se rota de 80 a 180 grados.
195
2. Dificultad de superposicin: problema para dibujar las partes de una sola figura que debe
ran traslaparse.
3. Simplificacin: se simplifica la figura.
4. Fragmentacin: la figura se descompone de
tal manera que se pierde la gestalt general.
5. Retrogresin: sustitucin con una forma gestalt
ms primitiva que el estmulo.
6. Perseveracin: los aspectos de un estmulo
anterior se llevan al estmulo actual.
7. Colisin: dos figuras independientes se superponen o chocan entre s.
8. Impotencia: numerosas borraduras e incapa-cidad para terminar un dibujo a satisfaccin
de la propia persona.
9. Dificultad de cierre: dificultad para lograr que
se toquen las partes adyacentes de una figura.
10. Falta de coordinacin motora: el temblor es
evidente en el dibujo.
11. Dificultad de angulacin: dificultad grave en la
reproduccin de los ngulos de los dibujos.
12. Cohesin: disminucin o incremento aislados
en tamao de una subparte de un dibujo.
Nota: Se puede contar un decimotercer error si la prueba completa requiere ms de 15 minutos.
Fuente: Basado en Lacks, P (1999). Bender-Gestalt screening forbrain dysfunction (2* edicin). Nueva York: John Wiley.
Leccin 30. Minimental Test
La herramienta de uso ms amplio para el estado mental es el Mini-mental state

examination, MMSE (Examen del Estado Minimental), una prueba de deteccin de 5 a
10 minutos que produce un ndice global del funcionamiento cognitivo (Folstein,
Folstein y McHugh, 1975; Tornbaugh, McDowell, Kristjansson y Hubley, 1996). La
prueba contiene 30 reactivos calificables que tienen que ver con orientacin, memoria
inmediata, atencin, clculo, produccin y comprensin del lenguaje y copia de
diseos. Los reactivos son tan fciles que la mayora de los adultos normales casi
siempre obtienen puntuaciones en el rango de 27 a 30 puntos.
La confiabilidad de este sencillo instrumento es excelente. Folstein y colaboradores
(1975) informan de una confiabilidad Test-retest a 24 horas de .89 para 22 pacientes
196
con diversos sntomas de depresin. La confiabilidad para un periodo de 28 das con 23

pacientes clnicamente estables con diagnsticos de demencia, depresin y
esquizofrenia fue un impresionante .99. Se encuentran disponibles datos normativos
que provienen de varias fuentes (p. ej., Lindal y Stefansson, 1993; Tombaugh,
McDowell, Kristjansson y Hubley, 1996).
Con una puntuacin de corte de 23 o menor como anormal y 24 o mayor como normal,
el MMSE tiene cerca de 80 a 90% de precisin en la identificacin de pacientes
ancianos de los que se sospecha la presencia de enfermedad de Alzheimer u otros
tipos de demencia. Esta puntuacin de corte produce menos falsos positivos (pacientes
normales a los que se clasifica dentro del diagnstico de demencia). La sensibilidad del
instrumento depende de varios factores, incluyendo la puntuacin de corte utilizada, el
nivel educativo de la persona evaluada, el grado de la demencia, la naturaleza de la
patologa subyacente y el tipo de entorno en el que se lleva a cabo la evaluacin
(Anthony, LeResche, Niaz, Von Korff y Folstein,
1982; Tombaugh, McDowell,
Kristjansson y Hubley, 1996; Tsai y Tsuang, 1979). A pesar de sus limitaciones, el

MMSE contina siendo la prueba ms confiable y prctica para la deteccin de
demencia en ancianos (Ferris, 1992). Debring, Van Gorp, Stuck y otros investigadores
(1994) recomiendan su empleo como parte de una batera corta de deteccin de la
declinacin cognitiva en ancianos. En el cuadro 9-14 se resumen medias adicionales
del estado mental geritrico.
197
198
CONCLUSIN
Lea y discuta con sus compaeros los aspectos ms importantes del artculo anexo
Importancia del Avance en la Investigacin Psicomtrica ubicado en la siguiente
direccin electrnica: http://www.salvador.edu.ar/psic/ua1-9pub02-7-01.htm
199
REFERENCIAS USADAS Y BIBLIOGRAFA RECOMENDADA
Anastasi, A. (1968). Psychological testing. New York: MacMillan.
Anastasi, A. y Urbina, S. (1997). Psychological Testing (7 ed.). Englewood Cliffs,

NJ: Prentice-Hall.
Arnau, J. (1989). Metodologa de la investigacin y diseo. En J. Arnau y H.

Carpintero (Eds.). Historia, teora y mtodo. Madrid: Alhambra Universidad.
Canpintero, H. (1996). Historia de las ideas psicolgicas. Madrid: Pirmide.
Cronbach, L.J. y Meehl, P.E. (1955). Construct validity in psychological tests.

Psychological Bulletin, 52, 281-302.
Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New
York: Holt, Rinehart and Winston.
Gregory, R. (2001). Evaluacin psicolgica: Historia, principios y aplicaciones. Mxico:
Manual Moderno
Hambleton, R.K. y van der Linden, W.J. (1982). Advances in IRT and applications: An
introduction. Applied Psychological Measurement, 6(4), 373-378.
Lord, F.M. (1980). Applications of item response theory to practical testing

problems. Hillsdale, New Jersey: Lawrence Erlbaum Associates.
Lord, F.M. y Novick, M.R (1968). Statistical theories of mental test scores. New
200
York: Addison-Wesley.
Martnez-Arias, R (1995). Psicometra: Teora de los tests psicolgicos y

educativos. Madrid: Sntesis.
Meli, J.L. (1990). La construccin de la Psicometra coma ciencia terica y
aplicada. Valencia: Cristbal Serrano.
Messick, S. (1989). Validity. En Linn, R.L. (Ed.). Educational measurement. New

York: MacMillan.
Muiz, J. (1991). Introduccin a los mtodos psicofsicos. Barcelona: PPU.
Muiz, J. (1998). La teora clsica de los tests. Madrid: Pirmide.
Nunnally, J. C. (1973). Introduccin a la medicin psicolgica. Buenos Aires:

Paids.
Rust, J. y Golombok, S. (1989). Modern psychometrics: The science of

psychological assessment. London: Routledge.
Thorndike, R. M. (1997). The early history of intellegence testing. En D. P.

Flanagan, J. L. Genshaft y Harrison, P.L. (Eds.), Contemporary intelectual
assessment, theories, tests and issues, (pp. 3-17). New York: The Guildford
Press.
Van der Linden, W. J. (1986). The changing conception of measurement in

education and psychology. Applied Psychological Measurement, 10, 325332.
201
Yela, M. (1968). Apuntes de psicometra y estadstica. Madrid: Universidad

Complutense de Madrid.
http://www.scribd.com/doc/3476657/Evaluacion-Psicologica1-tema-6
http://www.psicoactiva.com/software.htm

Modulo Psicometria2012 PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Modulo Psicometria2012 PDF

Caricato da

Copyright:

Formati disponibili

1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES

401517 CURSO DE PSICOMETRA

MELISSA JUDITH ORTIZ BARRERO

II. Gua Didctica

Fases del Aprendizaje

Tcnicas e Instrumentos para la Objetivacin del Aprendizaje

Portafolio de Desempeo Personal y Grupal

Unidad 1. Historia y conceptos bsicos de la psicometra

Leccin 4. Influencia de las primeras investigaciones sobre inteligencia

Leccin 23. 16pf

Validez, Confiabilidad, Pruebas psicolgicas,

Universidad Nacional Abierta y a Distancia -UNAD.

Autor del Protocolo:

rea del conocimiento: Ciencias Sociales y Humanidades

Estudiantes de pregrado del programa de

Metodologa de oferta: A distancia. (Campus Virtual)

Documentos impresos, Web.

1. Historia y conceptos bsicos de la Psicometra

2. Aproximacin al uso de las pruebas psicolgicas

El rea temtica abordar el estudio de los principios de la medicin y evaluacin

electrnicas cientficas de psicologa (medicin y psicometra). La participacin y el

Al ser un curso diseado para estudiantes de educacin a distancia, hace nfasis

La psicometra es una herramienta indispensable para las actividades relacionadas

La formacin en psicometra provee a los estudiantes la posibilidad de acercarse a la

particulares de resolucin de problemas psicolgicos, instalndolo en los procesos de

Cul ha sido el curso histrico que ha permitido el desarrollo de pruebas o test

Qu significan en la medicin los conceptos de validez y confiabilidad?

Qu pruebas se utilizan con mayor frecuencia en psicologa y que fenmenos

Para resolver estos y otros cuestionamientos, el presente curso acadmico

5. Contribuir a la mejora de hbitos de indagacin y pesquisa sistemtica travs

Que el estudiante adquiera los conocimientos necesarios y suficientes que

competencia, etc.), mediante el estudio de las diferentes teoras y modelos

Que el estudiante describa, relacione y comparare los aportes tericos y

Que el estudiante comprenda la importancia de la medicin, mediante el estudio y

Que los estudiantes adquieran las destrezas necesarias para la formulacin y

Capacitar a los alumnos para comprender y analizar crticamente la bibliografa

Que los alumnos conozcan y sepan utilizar adecuadamente los principales

Motivar positivamente a los alumnos hacia la Metodologa de las Ciencias del

Promover actitudes favorables a la investigacin cientfica y al mtodo cientfico

Inters por la investigacin y creacin de nuevos datos en Psicologa, tanto

Conocer y cumplir la normativa tica propia de la profesin y de la investigacin

Tener la capacidad de valorar los procedimientos utilizados para obtener datos

Transferencia y uso flexible del conocimiento.

Habilidad para transferir el conocimiento acadmico a las diferentes situaciones

Saber aplicar distintos mtodos de medicin, evaluacin y diagnstico en los

Conocer y respetar la diversidad psicolgica, las creencias y valores de otros

Tener inters y respeto por las aportaciones de otros campos a la Psicologa y

Manejo de informtica e Internet como usuario.

Saber planificar y realizar una bsqueda bibliogrfica o de referencias tanto en

Conocer y utilizar adecuadamente los conceptos cientficos propios de la

Saber comunicar resultados psicolgicos de forma oral adecuando la

Saber analizar, sintetizar y resumir la informacin procedente de textos

Identificar la conducta o el proceso psicolgico objeto de estudio, as como las

Reconocer los mtodos y tcnicas que se han usado en psicometra usando

Reconocer algunos hitos histricos del estudio de la medicin psicolgica a

Esbozar mediante mapas conceptuales, los componentes medulares de las

Analizar los conceptos y categoras fundamentales de las pruebas psicolgicas,

A travs del trabajo grupal, aplicar los conceptos bsicos de la medicin

Leccin 1. Antecedentes Y Formas

Leccin 6. Definicin De La Psicometra

Leccin 11. Confiabilidad (Completar)