Modulo de Psicometria

UNIVERSIDAD TECNOLOGICA BOLIVIANA
CARRERA PSICOLOGIA
Asignatura : PSICOMETRIA i
Docente : Lic. María Patricia

Canaviri Cusicanqui
SEMESTRE :3
periodo : i-2020
HUANCAYO, 2011
Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 1

CARRERA PSICOLOGIA
CAPACIDADES
1. Explica y describe los aspectos fundamentales de la psicometría.

2. Elabora, selecciona y diseña los diferentes ítems en los tests
psicométricos.
3. Distingue y reconoce las cualidades de los tests psicométricos.
4. Aplica la teoría psicométrica a los diversos campos de la psicología.
5. Maneja los análisis estadísticos de mayor uso en psicometría.

CARRERA PSICOLOGIA
ACTIVIDAD nº 01
PSICOMETRIA
FUNDAMENTOS DE LA TEORÍA Y LA PRÁCTICA DE LA PSICOMETRÍA

¿Es importante la psicometría?
La psicometría cada día nos confirma que todavía el hombre es único y que en nuestra
mismidad, como seres biológicos y sociales, cada uno es diferente psicológicamente del
otro; que las diferencias individuales existen de manera evidente y mensurable. El tipo de
análisis de la personalidad que se hace desde el modelo psicométrico pretende ser
objetivo y molecular. La objetividad la va a basar en la psicología matemática,
enfatizando los aspectos cuantitativos de la evaluación. Realmente, los desarrollos
realizados en metodología de la evaluación por este enfoque han sido significativos, y
definidores de la tarea diagnóstica. Los conceptos de fiabilidad y validez han sido y son
criterios clave para juzgar las pruebas psicológicas.
Modelo psicométrico, psicología matemática.
¿Qué área ha contribuido más para hacer de la psicología una ciencia? Se pregunta
Nuria Cortada (1999, 2000, 2001), a quien seguimos en lo fundamental en los avances de
la investigación psicométrica, su respuesta considera que ha sido la psicometría la que
empezó tratando de medir los constructos psicológicos y sigue en la lucha por la
matematización de nuestra ciencia para estar a tono con los avances de las demás
ciencias y con la complicada tecnología del tercer milenio.
En efecto cuando una ciencia tiene por objeto el estudio de procesos dinámicos necesita
un aparato formal para analizarlos. La psicología estudia muchos procesos como el
aprendizaje, la percepción, la memoria, la atención, los fenómenos cognitivos y
emocionales que son procesos que se refieren al cambio o modificación de una variable
en función de otras, como por ejemplo la evolución del aprendizaje en función de la
práctica, el declive de las huellas de la memoria en función del tiempo, el cambio de
niveles de percepción en función de los estímulos, el aumento de las funciones cognitivas
en relación al crecimiento, etc
Antecedentes históricos de la psicometría:
Las raíces de la aplicación de pruebas, se encuentran en la antigüedad partiendo de los

exámenes que se hacían en China para el servicio civil, hasta la aplicación de exámenes
en Grecia para evaluar las habilidades físicas e intelectuales.
De gran importancia fueron las aportaciones hechas en el siglo XIX por los médicos
franceses, Esquirol y Seguin. Aporte fundamental para el establecimiento de la
psicometría lo hicieron los investigadores Charles Darwin, Francis Galton, James McKeen
Cattell, Krapelin, Charles Spearman, T.L. Kelly, L.L. Thurstone, E.B. Titchener y otros.
Concepto de psicometría: La Psicometría es la ciencia cuyo objeto es medir los

aspectos psicológicos de una persona, como son: el conocimiento, las habilidades, las
capacidades, las actitudes o la personalidad. La Psicometría se encarga de los procesos
para la medida de los aspectos "psicológicos" de una persona, tales como conocimiento,
habilidades, capacidades, o personalidad. Las primeras pruebas psicometrías fueron
construidas para medir la inteligencia. Las bases teóricas de la psicometría parten de la
teoría de los tests y los métodos de elaboración de escalas.
Importancia de la medición en psicología: La importancia de la medición psicológica

radica en su afán por establecer científicamente la diferencia entre los rasgos y estados
psicológicos entre individuos para ello se utilizan diferentes escalas que apoyan la
medición objetiva de los atributos conductuales.
Medición y estadística: En 1816 Bessel Astrónomo de Greenwich, con base en sus

investigaciones descubre variaciones considerables entre individuos con respecto de la

CARRERA PSICOLOGIA
rapidez con que reaccionaban ante un estímulo visual (lo llamo ecuación personal), este
suceso tuvo gran relevancia para la psicología ya que sentó las bases para la medición
de al menos una característica mental (Tyler, 1978)
En la actualidad, la construcción de escalas y el análisis de datos obtenidos, perderían su
carácter de objetividad sin el uso de los métodos estadísticos (medidas de tendencia
central). La estadística permite determinar aproximaciones correlaciónales entre
variables. En la determinación de correlaciones entre dos variables, el análisis estadístico
es muy útil para condensar y analizar los datos.
La estadística es la disciplina que proporciona una metodología para recoger, organizar,
resumir, analizar datos y hacer inferencias a partir de ellas. La Estadística se divide en:
estadística descriptiva y estadística Inferencia. En la estadística descriptiva, se analizan
indicadores como: los porcentajes, la media, la moda, la mediana, la desviación típica, los
percentiles, etc. En el caso de la estadística inferencial, que es en la que se apoya la
psicología para hacer inferencias, los tópicos a analizar son las leyes del azar y el
concepto de probabilidad, los tipos de muestreo, diferencia de medias y análisis de
varianza.
La medición y las teorías psicológicas: Existen diversas teorías que tratan sobre la
razón por la cual las personas se comportan como lo hacer. Algunos teóricos centran el
énfasis en la herencia y el ambiente como modeladores del comportamiento humano. Las
teorías de los tipos, de los rasgos, psicoanalíticas, fenomenológicas, son útiles como guía
hacia la medición y comprensión de la personalidad.
Principios éticos y deontológico en la medición psicológica: “La deontología refiere a

los deberes relativos a una práctica determinada, los cuales, en su forma de enunciados
normativos se plasman en los llamados "códigos de ética". La deontología se aboca al
estudio de los deberes y obligaciones de los psicólogos, lo cual incluye el tratamiento de
ciertas problemáticas propias del campo deontológico, tales como, competencia,
idoneidad, integridad, capacitación, respeto por los derechos y dignidad de las personas,
responsabilidad profesional y científica, ámbitos de incumbencia. También se ocupa de
los deberes y obligaciones de los psicólogos en lo referido a declaraciones públicas,
publicaciones, actividades de investigación, supervisión, docencia, etc.”
Las escalas de medición en psicología: Medir es utilizar los procedimientos

matemáticos para asignar números e identificar atributos físicos y psicológicos que
permitan poner en claro las diferencias individuales. Una escala de medida permite al
investigador determinar el tipo de análisis estadísticos que deberá utilizar para examinar
una prueba y así poder considera a la prueba como buena.
Tipos de escalas: Son cuatro las escalas utilizadas para medir variables físicas y
psicológicas. Si se utilizan números para describir o nombrar algo la escala debe ser
nominal. En una escala ordinal los números se refieren a la clasificación ordenada de
objetos o eventos en función del rasgo que se mide. En las escalas de intervalo la
distancia entre intervalos tendrá que establecer valores iguales. Este tipo de escalas son
las más usadas para medir variables psicológicas y comparar diferencias interindividuales
o intraindividuales.
Las escalas de razón son las que poseen un cero real que significa ausencia total de lo
que se quiere medir (Coolican, 1997).
Métodos de elaboración de escalas: Cohen (2001) define “elaboración de escalas

como el proceso de establecimiento de reglas para la asignación numérica en la
medición. Es el proceso por el que se diseña y calibra un dispositivo de medición, y la
forma en que se asignan números (u otros índices), valores de escala a diferentes
cantidades del rasgo, atributo o característica que se este midiendo” (Cohen, 2001, pág.
288)

CARRERA PSICOLOGIA
Por lo regular existen diferentes métodos de medición escalar, los cuales pueden estar
abocados a medir personas, estímulos y tipos de respuesta. La medición escalar de
estímulos se puede realizar con base a estimaciones subjetivas, ya que se requiere la
tarea evaluativo del sujeto. Los modelos discriminativos son otra opción, estos modelos
ponen énfasis en la variabilidad de la respuesta a cada estímulo.
En la medición escalar de sujetos, los estímulos se constituyen en reactivos los cuales se

le presentan al sujeto para que proporcione un tipo de respuesta.
Son 3 los métodos para medir tipos de respuesta, los más importantes son: juicios y
sentimientos, respuestas comparativas y absolutas, escala de respuesta.
Escalas multidimensionales: Las técnicas de elaboración de escalas

multidimensionales se usan en caso de que el reactivo englobe más de una dimensión.
“El objetivo primario de los análisis multivariados es resumir grandes cantidades de datos
en relativamente pocos parámetros” (Nuria Cortada de Kohan)
Definición y función de las pruebas: (tests): Una prueba psicológica es una medida
objetiva y tipificada de una muestra de conducta. “Una prueba psicológica sirve de
estímulo para extraer un segmento de la conducta. Es rigurosamente estandarizada, o
sea se construye, se administra y se califica según reglas preestablecidas. Permite
comparar estadísticamente la conducta de un sujeto con un grupo de sujetos de una
población definida y clasificarla cuantitativamente, cualitativamente y/o tipológicamente”
(Costa, 1996; pág. 17)
Uso de las pruebas (tests) psicológicas: Las pruebas o tests se usan con motivo de
evaluar aspectos educativos, clasificación por ejemplo la inteligencia, en el área del
trabajo, para la selección de personal, las pruebas también son utilizadas para
diagnosticar la existencia o ausencia de problemas en el comportamiento, son un recurso
importante para comprobar hipótesis de investigación, en la clínica es un método para
diagnosticar comportamiento normal o patológico, o establecer un tratamiento
terapéutico.
Clasificación de las pruebas (tests): Las pruebas pueden clasificarse porsu objetivo
(potencia, ejecución máxima, ejecución de rasgos, o proyectivas). Por la forma o tipo de
respuesta que exigen (pruebas objetivas, subjetivas). Por la forma de administración
(aplicación individual o colectiva). Por la forma de dar las instrucciones.(Morales, 2002;
págs. 24-30).
Teoría de la Generalizabilidad. Fue desarrollada por Cronbach y sus colegas, esta

teoría parte de la idea que las puntuaciones de prueba de una persona varían de una
prueba a otra, debido a variables en la situación de prueba (Cohen, 2000; pág. 175).
La escuela americana (Thurstone): Thurstone no concordaba con la existencia de un

factor general y afirmaba que factores independientes o factores de grupo integraban la
inteligencia. Desarrolló un procedimiento matemático, denominado “análisis factorial
múltiple”, este método permite identificar un sin número de aptitudes que constituyen la
inteligencia y correlacionarlos entre sí.
La estructura del intelecto de Guilford: El realizó un estudio muy completo de las

aptitudes cognoscitivas, él y su colaboradores encontraron un sinnúmero de factores que
podrían ser relacionados unos con otros (Tyler, 1978)
Elaboro un modelo estructural de la inteligencia al que llamó estructura del intelecto. Este
constaba de tres dimensiones: operaciones (modos de pensar), contenidos (aplicaciones
del pensamiento) y productos (resultado de la aplicación de una operación a un
contenido.

CARRERA PSICOLOGIA
Teoría de la respuesta al ítem: Este es un modelo probabilística y permite conocer la

información proporcionada por cada ítem o reactivo y así crear tests individualizados. Son
escalas unidimensionales, ya que parten del supuesto de que cada ítem (reactivo) de la
prueba o test debe medir una sola aptitud o rasgo.
Teorías cognitivas y psicometría: La información almacenada en la memoria, consta de

huellas de actos constructivos anteriores, organizados de modo que corresponda a la
estructura de estos actos, sin embargo estos se relacionan en forma dinámica con la
nueva información, provocando transformaciones cognoscitivas en la memoria y el
pensamiento. (Neisser, 1979) “Sus dominios son la percepción, el aprendizaje, la
memoria, la resolución de problemas y la toma de decisiones y aunque los psicólogos
cognitivos tienden a subrayar la importancia de la variación de los estímulos y los
psicólogos diferenciales ponen el acento en la
importancia de la variación individual en ambos casos se están estudiando
comportamientos similares” (Nuria Cortada de Kohan)
Teoría triarquica de Stenberg: En esta teoría Stenberg combina la cognición y el

contexto para comprender la inteligencia humana y su desarrollo. La denominación de
triárquica se debe a que está formada por tres subteorías:
 La componencial, (inteligencia académica).

 La experiencial, (inteligencia creativa), y
 La contextual, (inteligencia práctica).

CARRERA PSICOLOGIA
ACTIVIDAD nº 02
MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR

UN INSTRUMENTO DE MEDICION
¿QUE IMPLICA LA ETAPA DE RECOLECCION DE DATOS?
Una vez seleccionado el tipo y el diseño de investigación apropiado y la muestra

adecuada de acuerdo a nuestro problema de estudio, la siguiente etapa consiste en
recolectar los datos pertinentes sobre las variables involucradas en la investigación.
Recolectar los datos implica tres actividades estrechamente vinculadas entre sí:
1.Seleccionar un instrumento de medición de los disponibles en el estudio del

comportamiento o desarrollare uno que sea válido y confiable, de lo contrario, no
podremos basarnos en sus resultados para realizar conclusiones.
2.Aplicar ese instrumento de medición, es decir, obtener las observaciones y mediciones

de las variables que son de interés para nuestro estudio.
3.Codificar, analizar e interpretar estas mediciones.
¿QUÉ SIGNIFICA MEDIR?
De acuerdo a definiciones clásicas como la de Stevens (1951), significa “asignar números

o valores a objetos y eventos de acuerdo a reglas”. Sin embargo, como lo señala
Carmines y Zeller (1979), esta definición es más apropiada para las ciencias físicas que
para las ciencias sociales, las cuales trabajan con una serie de conceptos más abstractos
que no pueden verse directamente o tratarse como productos o resultados.
Este razonamiento nos hace sugerir que es más adecuado definir medición como el
“proceso de vincular conceptos abstractos con indicadores empíricos”, proceso que se
realiza mediante un plan explícito y organizado para clasificar y frecuentemente
cuantificar los datos que me puedan suministrar conductas observables relacionadas con
las variables en estudio. El centro de atención es por lo tanto la respuesta observable
(bien sea una respuesta marcada en un cuestionario, una conducta grabada o una
respuesta dada en una entrevista). Un instrumento de medición adecuado va a ser aquél
que me registra datos observables que verdaderamente representan los conceptos o
variables (más abstractas) que el investigador tiene en mente.
¿QUÉ REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION?
Toda medición o instrumento de recolección de datos debe reunir dos requisitos

esenciales; confiabilidad y validez.
LA CONFIABILIDAD de un instrumento de medición se refiere al grado de precisión o

exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al
mismo sujeto u objeto produce iguales resultados. Es el caso de un balanza o de un
termómetro, los cuales serán confiables si al pesarnos o medirnos la temperatura en dos
ocasiones seguidas, obtenemos los mismos datos.
LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende

medir. Por ejemplo, un test de inteligencia no será válido, si lo que mide es realmente
memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy
fáciles de observar o de preguntar y obtener una respuesta válida. Pero cuando se trata
de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes,

CARRERA PSICOLOGIA
sentimientos, emociones, etc, la validez de un instrumento que pretenda medirlas se

torna más compleja, y por lo tanto, cabe preguntarse si ¿realmente el instrumento estará
midiendo lo que pretende medir?
LA VALIDEZ ES UN CONCEPTO DEL CUAL PUEDEN TENERSE DIFERENTES TIPOS

DE EVIDENCIA:
Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al grado

en que un instrumento refleja un dominio específico de contenido de lo que se mide. Por
ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si explora
suma y división y excluye problemas de resta y multiplicación. Un instrumento de
medición debe contener representados a todos los items del dominio de contenido de las
variables a medir.
Evidencia relacionada con el criterio. LA VALIDEZ DE CRITERIO implica que la medición

del instrumento se ajusta o sirve a un criterio externo. Si el criterio se ajusta al futuro se
habla de validez predictiva. Por ejemplo una prueba de admisión en las universidades
puede comparar sus resultados con el rendimiento futuro de los estudiantes en la carrera.
Si el criterio se fija en el presente se habla de validez concurrente; es cuando los
resultados del instrumento correlacionan con el criterio en el mismo momento o punto de
tiempo. Por ej. una encuesta administrada un día antes de las votaciones para detectar
preferencias del electorado, correlaciona con los resultados finales de la elección.
Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es

probablemente la más importante, sobretodo desde la perspectiva científica, ya que se
refiere al grado en que una medición aportada por un instrumento relaciona
consistentemente con otras mediciones que han surgido de hipótesis y construcción de
teorías antecedentes.
VALIDEZ TOTAL = Validez de contenido + validez de criterio + validez de constructo
Cabe agregar que un instrumento de medición puede ser confiable pero no válido, puede
medir consistentemente un aspecto más no medir lo que pretende medir el investigador.
Por ello es requisito que un instrumento de medición que demuestre ser confiable y
válido.
FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ
a)La improvisación. Algunas personas creen que elegir un instrumento de medición o

desarrollar uno es algo fácil y que no requiere de supervisión alguna. Para poder construir
un instrumento se requiere conocer muy bien la variable que se pretende medir y la teoría
que la sustenta.
b)El no estar validados en el contexto donde se aplican. Traducir un instrumento, aún

cuando adaptemos los términos a nuestro lenguaje no es ni remotamente validarlo. Es
simplemente un primer paso ya que validar un instrumento implica realizar una
investigación extensa y compleja. Los grupos, las personas cambian y tienen valores
diferentes de acuerdo a la cultura. Por lo tanto, se deben aplicar instrumentos ya
validados en el contexto.
c)El instrumento e inadecuado o no es empático. Hay instrumentos que tienen un

lenguaje muy elevado para el entrevistado o no toma en cuenta diferencias de sexo, edad
nivel ocupacional y educativo; todo esto puede resultar en errores de validez y
confiabilidad del instrumento de medición
d)El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El ruido,
presionar para que una persona conteste un instrumento largo en un período de tiempo

CARRERA PSICOLOGIA
corto, el hambre o falta de motivación para responder influirá negativamente en la validez

y confiabilidad de la medida.
e)El quinto factor se refiere a los aspectos mecánicos. Que el instrumento tenga
instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que no le
falten páginas, que haya un espacio adecuado para contestar.
¿CÓMO SE SABE SI UN INSTRUMENTO ES CONFIABLE Y VALIDO?

PROCEDIMIENTOS:
En la práctica es casi imposible que una medición sea perfecta, generalmente se tiene un
grado de error. Desde luego, se trata que este error sea el mínimo posible y para ello hay
formas de calcular la confiabilidad y la validez.
Para la confiabilidad, generalmente todos los procedimientos utilizan fórmulas que

producen “coeficientes de confiabilidad”, los cuales pueden oscilar entre 0 y 1, donde 0
significa confiabilidad nula y 1 representa el máximo de confiabilidad. Entre más se
acerque el coeficiente a 0 habrá mayor error en la medición. Los procedimientos más
utilizados son:
Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es aplicado

dos o más veces a un mismo grupo de personas. Si la correlación entre los resultados de
las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable..
Desde luego, el período de tiempo entre las mediciones es un factor a considerar. Si es
muy largo, otros factores como maduración o cambio de condiciones pueden afectar la
segunda medida. Si es muy corto, las personas pueden recordar cómo contestaron la
primera vez y aparecer como más consistentes la segunda vez.
Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el

mismo instrumento de medición sino dos o más versiones equivalentes de éste. Las
versiones deben ser similares en contenido, instrucciones, duración, etc. Por ej. cuando
un profesor administra 2 o más modalidades de examen en su grupo de alumnos. El
instrumento es confiable si la correlación entre los resultados de las dos o más pruebas
administradas es significativamente positiva.
Método de mitades divididas. Aquí se administra un solo instrumento, una sola vez, pero
se dividen las preguntas o los items (Por ejemplo los items pares con respecto a los
impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los
resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la
confiabilidad varía de acuerdo al número de items de la prueba. Cuantos más items
mayor es la confiabilidad.
Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos

de observación y registro. Dos o más observadores aplican el mismo instrumento al
mismo tiempo. Luego se calcula la correlación de aspectos coincidentes observados. Se
considera confiable el instrumento si hay un porcentaje de coincidencias superior al 80%.
Por supuesto que este método implica que los observadores tengan el mismo nivel de
preparación o de entrenamiento para observar.
Para calcular la validez, la validez que más interesa obtener en una investigación es la
validez de contenido. Para obtener validez de contenido primero que nada hace falta
revisar como ha sido tratada esta variable por otros investigadores anteriormente.
Segundo, elaborar un universo de items tan amplio como sea posible, para medir la
variable en todas sus dimensiones. Posteriormente, se consulta con investigadores
familiarizados con el tema y la variable a medir para ver si el contenido es exhaustivo.
Esto se conoce con el nombre de validación por expertos.

CARRERA PSICOLOGIA
PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION
1.El primer paso consiste en listar las variables que se pretenden medir u observar.
Recordemos que las variables son propiedades de los objetos o de los sujetos que
adquieren distintos valores y que son razón de nuestro estudio o fenómeno a investigar.
2.Revisar su definición conceptual y comprender su significado. Por ejemplo, comprender

qué es “integración escolar” y qué dimensiones o grandes aspectos envuelve.
La definición conceptual se refiere a la descripción de la esencia o de las características
propias, reconocidas por consenso de un fenómeno u objeto, a la cual se le llama
cotidianamente “definición real”; se reconoce la importancia de una conceptualización
teórica, dada por autores reconocidos.
3. Revisar cómo han sido definidas operacionalmente las variables. La

operacionalización de las variables se refiere a un conjunto de procedimientos que narran
o describen las actividades que el investigador realiza para medir las variables en
estudio.
Cuando el investigador dispone de varias opciones debe utilizar el procedimiento que le
reporte mayor información sobre la esencia del objeto o fenómeno de estudio.
3.Elegir el instrumento o los instrumentos (ya desarrollados) que han sido favorecidos
por la comparación y adaptación al contexto de la investigación. Deben seleccionarse los
instrumentos que reporten mayor validez y confiabilidad. Si se selecciona un instrumento
desarrollado en otro país deben hacerse pruebas piloto más extensas. Tampoco debe
olvidarse que traducir no es validar un instrumento, por muy buena que sea la traducción.
4.En caso de no encontrar un instrumento desarrollado adecuado, válido y confiable y se

quiera construir o desarrollar uno propio, debe pensarse en cada variable, sus categorías,
los indicadores más precisos y los items para cada uno de ellos. Un ejemplo de ello
podría ser el siguiente:
Variable
Definición operacional
Categorías
Indicadores
Items
Integración escolar
Grado de aceptación de la comunidad escolar regular para aprender y convivir con niños
especiales
Por parte de los Directivos
Interés y voluntad por aceptar niños especiales en su Institución
1.¿Desde hace cuanto tiempo se realiza integración escolar en este Centro?
2.¿De qién fue la iniciativa?
3.¿Cuáles fueron las estrategias para llevar adelante este proceso?
Por parte de los Docentes

Sensibilización y preparación para trabajar con niños especiales dentro de un aula regular
1.¿Cómo es su perfil de formación para trabajar con estos niños?
2.¿Qué adiestramiento ha recibido?
3.¿Cómo planifica y evalúa las actividades con estos niños?
4.¿Qué estrategias de integración practica?
Por parte de los Padres

Información y opinión sobre el proceso de integrar niños especiales en aulas regulares
1.¿En qué medida ha sido informado sobre el proceso de integración escolar que
adelanta la escuela?
2.¿Cuáles son a su juicio los aspectos favorables de la integración?

CARRERA PSICOLOGIA
3.¿Cuáles son los obstáculos o dificultades de este proceso?
En este caso, debemos asegurarnos de tener un número suficiente de items para medir
todas las variables en todas sus dimensiones.
El nivel de medición nominal indica que hay dos o más categorías de respuesta las
cuales no tienen orden o jerarquía. Por ej. cuando preguntamos el estado civil, la religión,
etc. Las variables nominales pueden ser dicotómicas (admiten solo dos valores, como el
sexo, tipo de escuela a la que asiste : privada u oficial, etc.) y politómicas (cuando
admiten tres valores de medición o más).
El nivel de medición ordinal, indica que hay varias categorías, pero además estas
mantienen un orden jerárquico, de mayor a menor. Por ejemplo el Grado o Nivel de
Instrucción de las personas, el cargo que una persona ocupa dentro de una empresa o
Institución, etc. En los dos niveles mencionados no se pueden utilizar las operaciones
matemáticas básicas, porque sería absurdo y no tiene sentido, darle numeración en
escala a las respuestas.
El nivel de medición por intervalo, implica crear escalas de medición donde las distancias
entre las diferentes categorías de respuestas son iguales. El cero o punto de partida, es
arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa
que no haya temperatura. Algunas escalas de observación y de medición de opinión de
actitudes suelen tratarse como si fueran mediciones de intervalo. Aquí se permite utilizar
las operaciones matemáticas básicas y algunas estadísticas. Ej. las escalas de
evaluación que los estudiantes llenan sobre sus profesores. ¿Cómo considera el sistema
de evaluación de la materia? 1 --- 2 --- 3 --- 4 --- 5 (1 = deficiente, 5 = excelente)
El nivel de medición de razón, además de tener todas las características del nivel de
intervalo (distancias iguales entre las categorías de respuesta y aplicación de
operaciones matemáticas básicas), implica que parte de un cero real y absoluto donde no
existe la propiedad a medir. Por ej. ¿Cuántos hijos tiene usted?
O --- 1 --- 2 --- 3 --- 4 --- 5 --- 6 --- 7 --- 8 --- 9 --- 10 ó más
Indicar cómo se han de codificar los datos . La codificación es necesaria para analizar
cuantitativamente los datos (aplicar análisis estadísticos). La mayoría de las veces se
usan números o cantidades, aunque también se pueden utilizar letras o símbolos.
Aplicar una prueba piloto del instrumento de medición. Es decir, aplicar el instrumento a
personas con características semejantes a las de la muestra o población objetivo de
nuestra investigación
En esta prueba se analiza si las instrucciones se comprenden y si los items funcionan
adecuadamente. Los resultados se utilizan para calcular la confiabilidad y de ser posible,
la validez del instrumento de medición. La prueba piloto se realiza con una pequeña
muestra; los investigadores aconsejan un 10% de personas semejantes a las que
integrarán la muestra definitiva.
Sobre la base de la prueba piloto, el instrumento de medición preliminar, se modifica, se

ajusta y se mejora, para lograr mayor nivel de confiabilidad y validez. En un trabajo de
investigación habrá que narrar el procedimiento, el pilotaje y la reestructuración del
instrumento posterior al pilotaje.

CARRERA PSICOLOGIA
ACTIVIDAD nº 03
LOS TESTS PSICOMÉTRICOS
Desde que la psicología, separada del corpus filosófico que le dio origen, empieza a
desarrollarse como disciplina científica, ha sido atravesada por distintos paradigmas y por
variadas concepciones y epistemologías, que tienen su anclaje en diferentes momentos
socio-históricos. El psicodiagnóstico, o, más específicamente el uso de las técnicas
diagnósticas, probablemente una de las prácticas más vinculadas identitariamente a la
psicología, no escapa a esos cambios, antes bien es causa y a la vez consecuencia de
los mismos.
La creación de los tests psicológicos, tiene su origen en la necesidad de medir y

cuantificar para de esta forma poder categorizar a los individuos. Este desarrollo, que
pauta un momento histórico para la disciplina psicológica, no está por supuesto carente
de ideologías y concepciones acerca del hombre. En tanto inaugura algo, ha dejado una
marca que en cierta medida sigue hasta nuestros días.
Plantearnos hoy que el par psicodiagnóstico-evaluación no sólo da cuenta de esa marca

sino que pone en evidencia al mismo tiempo el origen y la historia, en una suerte de
convivencia compleja de distintas concepciones que nos atraviesan en la actualidad.
Realizar una lectura crítica de los diferentes momentos de esa historia nos permitirá
pensar sobre las prácticas vigentes de modo que las mismas no queden naturalizadas
per se como científicas o no científicas.
Si bien a Francis Galton se le reconoce como precursor del empleo de tests para la
evaluación psicológica (1883), James Mckeen Cattell, fue el primero que los aplicó para
medir la inteligencia (1890), y Münsterberg inició los tests de aptitud profesional, no es
menos cierto que ya en 1575 el pregrafólogo español Juan Huarte de San Juan
reclamaba la necesidad de pruebas específicas (psicotécnicos) para los funcionarios de
la administración pública como un medio para conocer las aptitudes psicológicas
individuales y su correcta adecuación profesional.
El propio Alfred Binet junto a Víctor Henri (1895) recurrió el estímulo perceptivo de las
manchas en lo que sería un antecedente de técnica proyectiva formulado más tarde por
H. Rorschach. Será en 1904, cuando Jung elabore la primera prueba proyectiva: el test
de asociación de palabras. Éste se utilizó en criminología, intercalando vocablos
vinculados a los hechos inculpatorios, para estudiar la reacción del sujeto ante esas
palabras con fuerte carga emocional, y sus variaciones fisiológicas en las respuestas
verbales; Jung le llamaba "indicios de complejo". En contraposición Freud no consideraba
válida la práctica de la asociación libre para detectar a sujetos que han cometido un
delito, puesto que él que ha cometido realmente la acción fraudulenta, en la asociación
libre, no deja plenamente libertad, hace esfuerzos por controlar la situación; mientras que
por el contrario el neurótico, por sentimientos de culpa, va a delatarse, por el miedo a que
se den cuenta, precisamente de su miedo a que le crean culpable, es el llamado
delincuente por sentimiento de culpa. (Dr. Jorge Ulnik. Psiquiatra Psicoanalista de la
Facultad de Medicina de la Universidad de Buenos Aires).
En 1920, M. Klein, las emplea en el psicoanálisis de los niños, obteniendo excelentes

resultados, pues éstos se expresaban mejor ante el juego y el dibujo, y en 1920, aparece
la técnica del Rorschah, donde la personalidad de cada uno determina la percepción de
las manchas.
.- Fiabilidad o constancia de los resultados,

CARRERA PSICOLOGIA
ésta se verifica mediante varios sistemas (de la partición (Split-test-method), de la

repetición (test-re-test), de las formas paralelas...) más aptos para los psicotécnicos que
para las técnicas proyectivas, puesto que el material de estas últimas, al no ser un
cuestionario de preguntas, difícilmente puede dividirse a la mitad (Split-test-method) de
manera homogénea “ el total es mayor que la suma de sus partes” o el estímulo visual o
creativo en su repetición (test-re-test) pierde la fuerza y espontaneidad primera, siendo
sustituida por la “memoria y el deseo de variación”.
Comencemos con una pregunta inicial: ¿Que es un Test?: Una definición sencilla es
considerar a un Test como un instrumento de medición que tiene como finalidad “medir”,
evaluar algún aspecto puntual de la personalidad humana en particular , o el conjunto de
ella.
Rápidamente vendrán a nuestra mente la idea muy cierta por cierto, vale la redundancia,
de la enorme variedad de áreas, aspectos que podremos evaluar de la personalidad tan
rica, multifacético y llena de incógnitas.
Etimologicamente la palabra “Test” nos hemos encontrado que tiene una raíz latina, que
es “Testa” - “Testis” cuya acepción y uso nos remite a la Edad Media, estas se refería a
la vasija de barro que utilizaban los alquimistas para realizar sus experiencias,
recordemos que buscaban transmutar metales comunes en oro. Recordemos que la
Alquimia fue la precursora de la Ciencia conocida luego como Química. Hay mas allá del
experimento con los metales toda una construcción filosófico- espiritual en torno a los
alquimistas que eran considerados en esa época como grandes magos. Muchas
simbologías surgen de allí y en realidad se dice que lo que en el fondo buscaban como
trasmutación real era la de la individualidad humana.. Así transformar en oro los metales
equivale a transformar al hombre en puro espíritu .
Cada Test que los psicólogos e investigadores han construido responden a esta
búsqueda que ha perseguido (positivamente por supuesto) el hombre a lo largo de su
historia , la búsqueda del conocimiento de si mismo, recordemos la famosa y celebre
frase del Oráculo de Delfos que le decía al hombre “conocete a ti mismo” y es esta
necesidad de conocerse la que ha alimentado miles de formas y caminos de acceso a
ese conocimiento en parte posible de conocer y en parte vedado aún. Y aún mas
trascendiendo ya, la búsqueda individual se amplio al conocimiento de otras personas,
esto en la actualidad se lo llama investigaciones transculturales y muchas de ellas entre
ellas el T.A.T (Test de Apercepción Temática de Murray) , se ha aplicado a distintas
poblaciones con distintas culturas con el fin de encontrar semejanzas, y diferencias.
Podríamos decir que cuando aplicamos un Test o una serie de ellos, lo que buscamos es
no solo lograr un conocimiento profundo de una persona, aquellas características que
hacen a su naturaleza básica y aquellas otras que denotan la presencia se áreas
disfuncionales, sino también que ese conocimiento se convierta en información útil no
solo pro-curación de una determinada sintomatología cuyo núcleo o fuente intentábamos
identificar con las técnicas , sino también una información que a través de la devolución
que le otorgamos al paciente o a veces al profesional derivante, ponga de manifiesto
áreas potenciales de salud o recursos que a lo mejor esa persona no tiene a nivel
conciente registro de que los tiene. Conocer áreas desconocidas pero presentes de la
personalidad de uno provoca , a veces una transformación de la personalidad hacia un
nivel superior de funcionamiento que mejore la calidad de vida en un sentido amplio del
paciente o consultante, o un punta pie inicial hacia ella.
Esto implica que el uso de los Test no siempre esta al servicio de la Psicopatología y solo
mente recurrimos a ellos cuando hay alguna disfunción psicológica, sino también
podemos recurrir a ellos para conocerlo mas. Por supuesto los Test deben ser aplicados
por profesionales idóneos en la materia.
Los Test se agrupan en 2 grandes categorías:
1) Test o técnicas Proyectivas

2) Técnicas Psicometrías

CARRERA PSICOLOGIA
Las Técnicas Proyectivas a diferencia de las Psicométricas apuntan a la exploración y

diagnostico de la Personalidad Total o integral de un individuo. Las Técnicas
Psicométricas buscan explorar algún aspecto puntual de la personalidad , por ej. si una
persona posee un nivel de ansiedad importante, y de que tipo, así tenemos las Escalas
IDARE y STAIC que sirven para ello; las Escalas de Autoestima, Las Escalas para
evaluar presencia de Depresión como por ej. la de Beck, la de Alexitimia (incapacidad
para poner en palabras –²€alizar- lo que se siente), etc. Estas entonces no apuntan y no
permiten explorar la dinámica de la Personalidad como un todo, sino alguna de sus
partes y áreas.
Las técnicas Proyectivas pueden ser de 3 tipos:
a) Gráficas
b) Verbales
c) Lúdicas.
La diferencia entre ellas gira en torno al estimulo con el que se genera la proyección en el
sujeto. Valido es decir que en términos sencillos, Proyectar es poder poner en el afuera
algo que corresponde al adentro, así en cada Test que le proponemos a nuestro evaluado
algo del mundo interior del sujeto como en una pantalla se proyecta así.
Así cada Test mueve en el evaluado distintas cosas cada una diferente pero en un mismo
sentido, la personalidad , su dinámica, sus disfunciones, sus patologías, su manera de
percibir al mundo y así mismo, sus miedos, sus vacilaciones, sus seguridades, sus
potencialidades, su inteligencia, su inteligencia emocional ....la lista es muy extensa por
cierto.
Ampliando un poquito mas podemos decir:
Que en las técnicas graficas el estimulo que se le propone al sujeto una hoja en blanco ,
se le da un lápiz a veces una goma de borrar, y se le da alguna consigna, tal como
“dibuje un árbol”, “su familia”, “una casa” “una persona” “lo que usted quiera”, así es que
estamos frente a una consigna verbal y gráfica posteriormente.
En las técnicas proyectivas Verbales tales como: El test de las relaciones objetales de
Phillipson también llamado TRO, el T. A.T de Murray, el CAT-A de Bellack, el Rorschach,
el Test para adolescentes de Simon, el Test de Frustración de Rosenwaig el estimulo es
visual y verbal, ya que en todos ellos le pedimos al sujeto que nos construya una historia
con lo que ve en la lamina, que invente una historia, o que nos diga que ve en la lamina y
donde –Rorschach- .
En las Técnicas proyectivas lúdicas el estimulo es de acción, por ejemplo la terapia de l
juego en donde se le da al niño o a adolescentes distintos elementos con los cuales tiene
que interactuar.Otra técnica es el Psicodrama, en donde la consigna es que el sujeto
asuma determinados tipos de roles

CARRERA PSICOLOGIA
ACTIVIDAD nº 04 y 05
ITEMS DEL TEST

Antes tendremos que analizar los items de cualquier instrumento de medición que
utilizaremos con fines diagnósticos, se exige que ellos satisfagan ciertos requisitos, entre
los principales están las condiciones siguientes: Ser objetivos, confiables y válidos.
Por esto la consecuencia práctica es el aspecto más importante del análisis de los ítems,
cuando al eliminar los inadecuados o revisar los que necesitan mejorarse se garantiza la
confiabilidad y validez futura de la prueba, asegurando además las mejores condiciones
para su normalización.
En el análisis de los ítems se consideran tres criterios fundamentales:
 POR DIFICULTAD: se entiende el por ciento de sujetos que responden
correctamente al ítem. Este índice garantizará la dificultad baja, promedio o alta del
test según sea el objetivo del investigador.
 LA DISCRIMINACIÓN: es la segunda y más complicada parte del análisis de los

ítems, está caracterizada por el coeficiente de discriminación, que no es más que la
correlación entre la respuesta al ítem y la puntuación total de la prueba. Entonces la
discriminación se analiza a través de un criterio interno, por eso el problema ahora, es
averiguar la contribución del ítem a la puntuación total del test.
 LA VALIDEZ: del ítem se define mediante la correlación entre la respuesta

correcta de los sujetos al ítem y el grado en que él expresa la característica medida
con un criterio externo.
La importancia de estos criterios y los requisitos que se le imponen al ítem con respecto a
ellos, dependen del Test de que se trate y de los que persiga el investigador. Después de
analizar los ítems de un test, es posible también indagar sobre el pronóstico de la validez
y la confiabilidad de la prueba total. El análisis de la validez solo es posible hacerlo
cuando en la base de datos del análisis de los ítems, se tiene información sobre los
coeficientes de validez además de los de discriminación, mientras que la posibilidad de
pronosticar la confiabilidad siempre está garantizada.
ELABORACIÓN Y SELECCIÓN DE LOS ÍTEMS:
Según como seleccionamos los ítems el test tendrá un contenido. Las preguntas y
alternativas de respuesta son el protocolo del test. Los ítems son verbales, gráficos o
manipulativos. El tipo de ítems tiene que ver con sí el sujeto responde de forma libre,
estructurada o de forma mixta
 Ítems de respuesta libre: El sujeto debe responder con sus propias palabras, no
hay una única respuesta. Es la más completa. El sujeto desarrolla de forma abierta y
libre una respuesta ante una pregunta que se plantea, desde una perspectiva personal
y su propio lenguaje. Puede ser verbal, manipulativo o gráfico.
Ventajas: se recoge la creatividad/originalidad de la respuesta del sujeto, se permiten
varias respuestas verdaderas y se puede valorar no solo lo que dice sino también
cómo lo expone y lo construye (información adicional).
Desventajas: la subjetividad a la hora de construir y, fundamentalmente, a la hora de
valorar estos ítems (diferentes evaluadores no llegan al mismo acuerdo, es diferente
según el juez, evaluación sesgada, a no ser que evalué un solo juez).
Sobre los demás tiene la ventaja de tener la mejor manera de valorar la creatividad y
originalidad del sujeto.
 Ítems de respuesta restringida. En los que se le pide una respuesta breve, tiene
menor libertad pero se puede ampliar el número de ítems (hacer más preguntas).
Ventajas: corrección rápida y se llega a un acuerdo entre jueces.
Desventajas: perdemos mucho la valoración de la creatividad del sujeto y sigue
siendo subjetiva.
 Ítems de respuesta estructurada: Se pierde totalmente la posibilidad de valorar
respuestas creativas (p.e. exámenes tipo test), se le dan las respuestas al sujeto y se
le pide que elija una alternativa. La muestra es mucho mayor, se hacen más

CARRERA PSICOLOGIA
preguntas. Se responde a cada ítem por separado, son independientes entre sí y se

suelen puntuar uno a uno.
Ventajas: permiten la comparación de grupo por presentar las mismas respuesta a
cada sujeto. Más fáciles de cuantificar, mayor precisión, hay una clave de corrección
clara y por ende, más acuerdo entre los jueces.
Desventaja: menor libertad a la hora de responder, no se valora la originalidad y
creatividad. Perdemos cualidades, son muy atomistas (analiza una pequeña parte del
comportamiento del sujeto). Existen diferentes tipos:
 Ítems de respuesta alterna. Verdadero-falso, sí-no:
-Utilización de términos que no sean generales o universales, pues son erróneos (nunca,
siempre, todas, ninguna...)
-Evitar el empleo de términos ambiguos o indefinidos para asignar cantidad (p.e. hace
ejercicio frecuentemente?, la interpretación de este puede variar de una persona a otra).
Es necesario poner cantidad (3, 4 o más veces por semana).
-Procurar no utilizar negaciones (enunciados negativos) y muchísimo menos la doble
negación (pues esto afirma).
-Limitar los enunciados de verdadero-falso a una sola idea (una idea para cada
enunciado)
-Que los enunciados tengan aproximadamente la misma extensión (p.e. generalmente,
un enunciado verdadero es más extenso que uno falso).
Ventajas: se pueden construir muchos, recoger más muestras de conducta, son
fáciles de corregir y rápidos.
Desventajas: difíciles de construir, pierde la capacidad de creatividad.
 Ítems de elección de respuesta múltiple:
-Poseen más de dos alternativas, generalmente de 3 a 5. Son más flexibles, representan
mejor lo que quieren evaluar, hay más opciones para el sujeto.
-Es necesario delimitar bien el enunciado de las alternativas de respuesta. El enunciado
debe contener toda la pregunta (saber que estamos preguntando y poner las alternativas
pertinentes). El enunciado puede ser amplio pero las alternativas de respuesta deben ser
breves.
-El enunciado debe ser claro y específico, claramente expuesto (cuál es nuestra
pregunta) y que sea positivo, no utilizar la doble negación (pues esta evalúa lo peor de
una persona no lo mejor).
-Asegurarse de que haya solo una respuesta válida o que expresa mejor lo que se
pregunta (p.e. en los test de personalidad, la respuesta que manifiesta mejor ese rasgo).
Que haya una única respuesta óptima, evidente sobre las demás y asegurarse de que las
otras también sean plausibles.
-No proporcionar indicadores involuntarios para las respuesta (todas tienen que
acercarse a lo que quieren medir).
Ventajas: suele ser más objetiva la corrección, existe un mayor acuerdo y se puede
corregir mediante el uso del ordenador (p.e. en la selección de personal). Se corrige
rápidamente y de forma objetiva se puede comparar y el número de ítems es amplio
para tener una muestra representativa de la conducta del sujeto. Recogen mucha
información en poco tiempo.
Desventajas: para redactarlos bien lleva mucho tiempo (su construcción), no permiten
analizar la creatividad del sujeto. A veces es difícil determinar cuándo una respuesta
óptima es correcta sobre las demás. Su utilización depende del ámbito de trabajo, por
ello puede ser mejor o peor en una determinada situación (p.e. para aplicaciones
grupales son buenas pero en el ámbito clínico no, serían mejores las de ensayo).
 Ítems de completamiento: son semiobjetivos o mixtos: mezclan los ítems de
respuesta libre y los estructurados. Hay mayor flexibilidad y hay varias respuestas
correctas.
CARACTERISTICAS
 Si cada ámbito va ser valorado igual habrá un mismo número de ítems para cada
área (p.e. la asertividad en la familia, el trabajo, con los amigos), si le damos más
relevancia mayor número de ítems y obtener más muestras de conducta.

CARRERA PSICOLOGIA
 ¿Cómo elegimos los ítems? - La elección de los ítems la hace el autor de los test,
tomando en cuenta:
 Que sean representativos del atributo que quiero medir, ¿cómo se manifiesta ese
atributo? observación directa, definir cuál es la manifestación, tomar datos de campo.
 Hasta que punto necesito una precisión de los datos, cuanto más estructurado es un
ítem más preciso es pero menos creativo. Qué quiero evaluar y qué precisión quiero;
me interesan los datos cualitativos o cuantitativos, describir (cualidad, ensayo) o
predecir (cantidad, respuesta alternativa).
 Las personas, a quien voy a evaluar, considerar edad, nivel sociocultural, académico,
contexto, ambiente. Variables del sujeto.
 Forma de administración: individual o colectiva.
 Tiempo disponible (las pruebas verbales son más rápidas de aplicar y corregir que
una manipulativa o gráfica)
 Longitud (cuántos ítems tendrá la prueba): Ver la característica que quiero evaluar y lo
amplia que es (p.e. una característica de personalidad es más amplia que el clima
familiar, más concreto), y ver si tengo de esa característica tengo más áreas de
evaluación, si es así necesitaré más ítems. Cada uno de los ítems es una muestra de
conducta, cuántas más tengamos mejor podremos entender al sujeto pero sin perder
el equilibrio (no preguntas en exceso).
 Tipo de ítems elegidos (la prueba es más larga o corta según los ítems, las pruebas
verbales tienen más ítems, los manipulativos son menos). Demarcar la longitud del
test.
 Finalidad del instrumento, según ella la longitud puede cambiar.
 Forma de aplicación. Los test individuales suelen tener menor número de ítems, en
los colectivos se pierden la relación de tú a tú y otra información, hay que tener más
preguntas, son más amplios que los individuales (p.e. tiempo de reacción WAIS,
dificultad de los ítems y cuánto tiempo necesita para pensar y responder).
 Características del sujeto. Tiempo de aplicación, si tenemos menos tiempo utilizamos
test cortos. No hay normas fijas, depende de estos apartados y del autor.
 dificultad de los ítems: Tomar en cuenta el tipo de prueba, en las de personalidad
tendrá que ser una dificultad media y media-alta, en los test de manipulativos y de
inteligencia existirán diferentes niveles. Por ende, hay que valorar lo que mide la
prueba y el tipo de sujetos a evaluar (tipo de ítems, presentación, áreas de contenido
y características del sujeto marcarán la dificultad). Es importante que el nivel de
lectura o lenguaje de los sujetos evaluados no sea un obstáculo para responder a las
tareas, debe estar adecuado a su nivel de lenguaje. La única excepción sería si se
trata de una prueba en que se evalué el rendimiento en el lenguaje, pero en ellas
poco a poco se va aumentado el grado de dificultad para que el sujeto encuentre
ítems que pueda resolver. (p.e. para un niño son más difíciles los ítems verbales que
los gráficos).
APLICACIÓN, CORRECIÓN Y PROCEDIMIENTOS ESTADÍSTICOS DE LOS ITEMS:
Hay que aplicar el test y para ello tenemos que tener en cuenta:
 Delimitar unas normas claras de aplicación.
 Tener elegida de forma clara la muestra representativa.
 Aplicar el test: Recoger datos significativos.
Ahora hay que hacer un análisis de los ítems a dos niveles:
 Cualitativo: análisis lógico- racional.
 Cuantitativo: análisis empírico de las propiedades estadísticas de cada uno de
los ítems.
A. ESTADÍSTICA DE ÍTEMS: es tan económica como la anterior. Una sola medida.
Valora la consistencia interna con criterios internos. Comparamos las
puntuaciones de cada ítem con la puntuación obtenida en el test completo.
 Se considera a cada ítem como un test individual. Comparación de cada ítem con
la puntuación total del test.
 Se supone que todos los ítems tienen la misma varianza y la misma media
utilizamos la formula de Kuder- Richardson.

CARRERA PSICOLOGIA
 Si las varianzas y medias son distintas:

 Los distintos métodos nos dan diferentes medidas de confiabilidad, varían en
cuanto al grado y en cuanto al contenido
INSTRUMENTOS PSICOMETRICOS
A.- DE INTELIGENCIA B.- DE PERSONALIDAD CONSEJOS PARA REALIZAR
ESTAS PRUEBAS TIPOS DE PRUEBAS No evalúan ni lo que sabes ni lo que sabes
hacer, sino lo que podrías llegar a saber y a hacer, es decir, tu potencial. Lo importante
aquí es no considerar que si no pasas una prueba psicotécnica, es porque eres medio
tonto. En realidad, cada empresa decide qué busca al pasar un psicotécnico (por
ejemplo, para un puesto de trabajo determinado, puede que la empresa no seleccione
a personas con una inteligencia superior a la media -según el test, claro- porque no
desempeñaría bien el trabajo). Los test que suelen pasar en una selección de
personal, suelen depender del puesto de trabajo, es decir, si te presentas para
administrativo, seguramente pasarán un test numérico (si lo tuyo no son los números,
tendrás que destacar más en otras habilidades que se requieran, o pensar en otros
puestos de trabajo, en los que los números no sean tan importantes).
B.- DE INTELIGENCIA TEST DE AMPLITUD: Miden el conocimiento y/o el
rendimiento. Pueden valorar la memoria, precisión, destreza, atención, sentido de la
organización, agilidad manual y mental. -MATRICES DE RAVEN: Orientados a la
valoración de la inteligencia concreta, nivel de observación y organización lógica.
Consiste en descubrir qué figura corresponde al cuadro en blanco de los otros que
aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que
mantienen un orden lógico. Interesan la identificación y la diferenciación de formas.
Son ejercicios en orden de dificultad creciente. El tiempo está limitado, con lo cual hay
que evitar estancarse en un ejercicio. -FICHAS DE DOMINÓ: Miden la abstracción
lógica. -TEST DE RAZONAMIENTO: Miden las facultades de adaptación: agilidad
mental, resolución de problemas, etc. -TEST DE COMPRENSIÓN VERBAL: Miden la
comprensión de ideas, facultad de análisis y síntesis.
C.-DE PERSONALIDAD • -TEST DE RORSCHACH: Analiza las dimensiones
intelectual, afectiva y de comportamiento. -TEST DE APERCEPCIÓN TEMÁTICA:
Evalúa los factores y necesidades de la conducta y de las motivaciones, valorando las
emociones y estados internos. -TEST DE ÁRBOL: Revela a la persona en la vida
interior y el desarrollo afectivo. En definitiva en un prueba psicotécnica nos podemos
encontrar los siguientes puntos: • Test de información: Evalúan cuestiones
relacionadas con el vocabulario, fluidez verbal y significado de las palabras. •
Problemas aritméticos: Intentan medir la capacidad para resolver problemas
aritméticos y matemáticos mediante ejercicios relacionados con números. • Series
numéricas: Estos ejercicios prueban la capacidad para resolver problemas aritméticos
y matemáticos, convirtiéndose en una buena forma de medir el razonamiento inductivo
o razonamiento abstracto. Las series numéricas pueden presentarse de forma que el
individuo complete los números que faltan o bien se les da a elegir el número siguiente
entre varias alternativas posibles. • Series alfabéticas: Del mismo modo que con las
series numéricas, se pretende medir también el razonamiento abstracto. • Problemas
de razonamiento no verbal: Son test que se han creado con figuras o símbolos para
medir la inteligencia general o el razonamiento abstracto. • Ejercicios de visualización:
Evalúan la capacidad para captar relaciones espaciales. Es importante para aquellas
personas que deben manejar objetos, máquinas, planos, etc. • Test de capacidad
mecánica: Tienen como finalidad identificar a aquellos individuos con aptitudes para
trabajos de carácter mecánico y trabajos de mantenimiento. • Test de personalidad:
Tratan de buscar rasgos de carácter, acordes con el perfil del puesto: introvertido o
extrovertido, dinámico o pasivo, optimista o pesimista, con iniciativa o sumiso,
impulsivo o moderado, etc. • Test de aptitudes administrativas: Sirven para medir la
capacidad de percepción, rapidez de lectura, de precisión en actividades específicas,
cálculo aritmético, comprobación de datos, ortografía, archivo, comprobación de
errores, etc.

CARRERA PSICOLOGIA
AVTIVIDAD 06
INSTRUMENTOS PSICOMÉTRICOS
El Mini Mental StateExamination (MMSE) de Folstein.
DESCRIPCION:
Diseñado por Folstein y McHung en 1975, con la idea de proporcionar un análisis breve y
estandarizado del estado mental que sirviera para diferenciar, en pacientes psiquiátricos,
los trastornos funcionales orgánicos.
Hoy en día, se utiliza sobre todo para detectar y evaluar la progresión del Trastorno
Cognitivo asociado a Enfermedades Neurodegenerativas como la de tipo Alzheimer. El
MEC fue la primera versión en castellano del MMSE, adaptada por Lobo y col. La versión
de 35 puntos, fue la primera y es la más utilizada actualmente. Se trata de una sencilla
escala estructurada, que no requiere más de 5 – 10 minutos para su administración.
Sus ítems exploran 5 áreas cognitivas:

Orientación, Fijación, Concentración y Cálculo, Memoria y Lenguaje
INSTRUCCIONES GENERALES:
Invitar al entrevistado a colaborar. No corregir nunca al paciente, aunque se equivoque.
Contabilizar los puntos correctos de cada uno de los 5 ítems del test.
1. Orientación: No se permite la Comunidad Autónoma como respuesta correcta
para la provincia ni para nación o país(excepto en las comunidades históricas).
2. Fijación. Repetir claramente cada palabra en un segundo. Le damos tantos puntos
como palabras repita correctamente al primer intento. Hacer hincapié en que las
recuerde, ya que más tarde se le volverán a preguntar. Asegurarse de que el
paciente repita las tres palabras correctamente hasta que las aprenda. Están
permitidos seis intentos para que las repita correctamente.
3. Concentración y Cálculo: Sustracción de 3 en 3. Si no le entiende se puede
reformular la pregunta. Si tiene 30 pesetas y me da tres ¿cuántas le quedan?, y
seguir pero sin repetir cifra que dé el paciente. Se dará un punto por cada
sustracción correcta.
Repetir los dígitos 5 – 9 – 2 lentamente: 1 segundo cada uno, hasta que los
aprenda, se le da 1 punto por cada dígito que coloque en posición inversa
correcta.
4. Memoria: Dar un amplio margen de tiempo para que pueda recordar sin ayudarlo.
1 punto por cada palabra recordada sin tener en cuenta el orden.
5. Lenguaje y construcción: El entrevistador ha de leer la frase poco a poco y
correctamente articulada, un error en la letra, es 0 puntos en el ítem:
Semejanzas: En las semejanzas perro-gato las respuestas correctas son
animales de “x” características. Órdenes verbales, si el paciente coge el papel
con la mano izquierda, se valorará como error, si lo dobla más de dos veces es
otro error.
Lectura, escritura y dibujo: Si utiliza gafas se solicita que se las ponga.
Frase: Advertir que no se considerará correcta si escribe su nombre. Si es

necesario se le puede poner un ejemplo, pero insistiendo en que ha de escribir
algo diferente. Debe construir una frase con sujeto, verbo y complemento para
valorarla con un punto.
Figura. Cada pentágono ha de tener exactamente 5 lados y 5 ángulos y debe
entrelazarse en dos puntos de contacto.
PUNTUACIÓN:
La puntuación total máxima es de 35 puntos.

CARRERA PSICOLOGIA
Excluimos las preguntas que hayan sido eliminadas, básicamente por analfabetismo o
por imposibilidad física de cumplir un ítem (ej.: ceguera). Entonces calculamos la
puntuación total corregida: la obtenida por regla de tres después de corregir la puntuación
total.
Ejemplo, si el paciente es ciego y no puede acceder a 4 de los 35 puntos posibles, la
puntuación final se calculará sobre 31 puntos posibles. Imaginemos que la puntuación
total ha sido 20, aplicando la corrección obtenemos una puntuación (20x35/21) = 22,5
(redondearemos al núm. entero + próximo, el 23).
INTERPRETACIÓN:
Instrumento sencillo y breve de aplicación, no requiere de especiales habilidades para su

administración. La edad y la escolarización influyen en la puntuación total.
Existen limitaciones a su uso en pacientes con bajo nivel cultural, analfabetos o con
déficit sensoriales.
No explora todas las áreas cognitivas. Posibilidad de que pasen inadvertidos los casos
incipientes de deterioro cognitivo.
RANGO de PUNTUACION 0 – 35.
Lobo y col, proponen:
Pacientes GERIATRICOS:(> de 65 años), punto de corte 23/24; es decir, 23 ó menos
igual a “caso” y 24 ó más a “no caso”.
Pacientes NO GERIATRICOS punto de corte 27/28 (es decir, 27 0 menos igual a “caso”,
y 28 ó más igual a “no caso”.
Cuestionario de Estado Mental
Portatil de Pfeiffer
DESCRIPCION
Fue diseñado por Pfeiffer en 1975 como test de screening de deterioro cognitivo.Se
encuentra validado en nuestro país por García-Moltalvo.
Se trata de un cuestionario heteroaplicado de 10 ítems, sobre cuestiones muy generales

y personales. Se puede pasar en 4 –5 minutos. Se van anotando las respuestas
erróneas. Se permite un fallo de más si el paciente no ha recibido educación primaria y
uno de menos si tiene estudios superiores.
Explora la:
Memoria a corto plazo.
Orientación.
Información sobre hechos cotidianos, y la Capacidad de cálculo.
INTERPRETACIÓN.
Detecta tanto la presencia de deterioro cognitivo como el grado del mismo. Las
cuestiones con varias respuestas sólo se aceptan como correctas si todos los elementos
de la misma lo son.
Para población de raza blanca y nivel cultural medio se considera:

- NORMAL de 0 a 2 errores.
- Deterioro cognitivo Leve de 3 a 4 errores.
- Deterioro cognitivo MODERADO (Patológico) de 5 a 7 errores,
- Deterioro cognitivo Importante de 8 a 10 errores.
Sus valores psicométricos arrojan valores bajos de sensibilidad en estudios realizados

en la comunidad (S 34 – 48% y E 94- 95 %) y mejorando éstos en casos diagnosticados
de grados moderados o severos de demencia.

CARRERA PSICOLOGIA
Enfatiza mucho el lenguaje y la memoria y tiene una intensa orientación verbal. Por lo
que en algunos tipos de déficit sensoriales o trastornos psiquiátricos (depresión) podría
dar falsos positivos. A pesar de haber sido diseñado para screening, no detecta deterioros
leves ni cambios pequeños en la evolución del deterioro cognitivo.
Es un test muy rápido de administrar que no requiere especial entrenamiento, lo que lo

hace muy indicado en los CRC... Se ha mostrado especialmente útil en invidentes,
personas de edad avanzada y analfabetos. Especialmente útil para screening en
población general.
PROPIEDADES PSICOMETRICAS
- Fiabilidad:La fiabilidad test-retest oscila entre 0,82 y 0,85.
- Validez: Los índices de correlación con otros instrumentos similares: son 0,76 al 0,88
con el Mental Status Questionnaire.
- Sensiblidad: Según varios estudios recogidos por Del Ser la sensibilidad, varía del 68 al
82 % y la Especificidad del 92 al 96%.
Trastornos orgánicos: Ansiedad Depresion

Trastornos del ESTADO DEL ÁNIMO
Depresión
Actualmente se conocen más de 100 escalas, lo que nos da una idea de las limitaciones
de estas herramientas y del hecho de que no existe ningún instrumento "ideal".
En las escalas todos los síntomas son igual de importantes y se suman ítems vegetativos
o cognitivos de forma intercambiables. Por eso, estas escalas no permiten realizar el
diagnóstico de dapresión y mucho menos especificar de qué tipo de depresión se trata...
Su función es evaluar la intensidad de los síntomas una vez que se ha realizado el
diagnóstico.
OBJETIVO DE LA ESCALA:
Son 3 los objetivos principales de las escalas para evaluar la depresión:
- Cuantifica la intensidad de la depresión en sujetos ya diagnosticados.
- Evalúa la efectividad del tratamiento.
- Cribaje en población general o en población clínica.
CARACTERISTICAS ESPECÍFICAS:
La primera de las escala desarrolladas para evaluar la depresión fue la de HAMILTON, y
con ella nacía la moderna psicometría.
1. La Escala de HAMILTON. Es la más utilizada y sirve de referencia para todas las
demás. Que deben demostrar una buena validez convergente con ésta....... Su
mayor limitación es que requiere cierto entrenamiento por parte del entrevistador
por lo que encarece su uso.
2. La Escala de BECK. Es la más empleada de las escalas autoadministradas en
depresión.
3. Escala Ansiedad Depresión de GOLDBERG. Es una de los tests utilizado como
instrumento de cribaje en depresión y ansiedad. Es breve, fácil de administrar y
sirve como guía clínica.
4. Escala Ansiedad Depresión Hospitalaria. Especialmente indicada en pacientes
hospitalizados con co-morbilidad orgánica.
Estas dos últimas escalas no evalúan específicamente depresión ya que también

incluyen ansiedad. El problema de a ellas es que no discriminan bien ambas
entidades.
El solapamiento entre las escalas de ansiedad y depresión no debe atribuirse
necesariamente a una mala construcción del instrumento, sino a la mala
delimitación de ambos síndromes clínicos. Por eso se tienden a emplearse como
medidas de malestar general, en la línea del General HeatthQuestionnaire (GHQ).

CARRERA PSICOLOGIA
Trastornos del ESTADO DEL ÁNIMO

Ansiedad.
A la hora de seleccionar una escala para medir la ansiedad es conveniente considerar el

diagnóstico. La Ansiedad como síntoma es ubicua y puede presentarse en casi todas las
enfermedades psiquiátricas, no solo en los trastornos de ansiedad.
Las escalas que nosotros vamos a utilizar miden fundamentalmente trastornos de

ansiedad y suelen emplearse las escalas AUTO – EVALUADA.
CARACTERISTICAS ESPECIFICAS DE CADA INSTRUMENTO.

 Escala de HAMILTON:
Es la primera de las escalas desarrolladas para evaluar la ansiedad en sentido
general. Es la más utilizada, después del Cuestionario de ansiedad Estado Rango
(STAI) para evaluar la intensidad de los síntomas en los trastornos de ansiedad.
De hecho, sirve de referencia o "patrón oro" para todas las demás escalas de
ansiedad, que deben demostrar una buena validez convergente. Por tanto, puede
emplearse como primera elección en cualquier situación.
Sus mayores limitaciones son:
- Requiere cierto entrenamiento por parte de los entrevistadores.
- Es una escala general, poco útil si queremos evaluar Trastornos de ansiedad
específicos como la Fobia,
- Trastornos de angustia y mucho menos Trastornos obsesivo-compulsivos.
 Escala de ZUNG.
Es posterior a la de Hamilton y mide la ansiedad general. Se desarrollaron dos
versiones: Una HETEROEVALUADA por un clínico (ASI), y Otra
AUTOEVALUADA, la SAS.
A diferencia de la escala de Zung de depresión, su validez no ha sido tan
cuestionada.
Su principal ventaja es que no incluye ningún ítem que evalúe la depresión,

limitación que si se observa en la de Hamilton, por lo que el poder discriminativo
ansiedad / depresión es mayor en la escala de Zung.
 Escala de BECK.
La escala auto - administrada se utiliza para detectar pacientes con ansiedad en
cualquier población, para medir la intensidad de la ansiedad en pacientes
diagnosticados y para monitorizar tratamientos farmacológicos o psicológicos.
Inventario de DEPRESION de BECK
BeckdepressionInventory (BDI) y col, 1961
DESCRIPCION.
El inventario de Depresión de Beck (BAI) fue desarrollado inicialmente como una escala
heteroaplicada de 21 ítems para evaluar la gravedad (intensidad sintomática) de la
depresión, conteniendo cada ítem varias fases autoevaluativas que el entrevistador leía al
paciente para que éste seleccionase la que mejor se adaptase a su situación; sin
embargo, con posterioridad su uso se ha generalizado como escala autoaplicada.. Beck y
cols.(1979) da a conocer una nueva versión revisada de su inventario, adaptada y
traducida al castellano por Vázquez y Sanz (1991), siendo ésta la más utilizada en la
actualidad.
Es un cuestionario autoaplicado de 21 ítems que evalúa un amplio espectro de síntomas

depresivos. Se sistematizan 4 alternativas de respuesta para cada ítem, que evalúan la
gravedad / intensidad del síntoma y que se presentan igualmente ordenadas de menor a
mayor gravedad. El marco temporal hace referencia al momento actual y a la semana

CARRERA PSICOLOGIA
previa. Ni la numeración de las alternativas de respuesta, ni los enunciados de los

distintos ítems deben aparecer en el formato de lectura del cuestionario, ya que al dar
una connotación clínica objetiva a las frases pueden inflluir en la opción de respuesta del
paciente.
Su contenido enfatiza más en el componente cognitivo de la depresión, ya que los

síntomas de esta esfera representan en torno al 50% de la puntuación total del
cuestionario, siendo los síntomas de tipo somático/vegetativo el segundo bloque de
mayor peso; de los 21 ítems, 15 hacen referencia a síntomas psicológicos-cognitivos, y
los 6 restantes a síntomas somáticos vegetativos.
INTERPRETACION
El paciente tiene que seleccionar, para cada ítem, la alternativa de respuesta que mejor
refleje su situación durante el momento actual y la última semana. La puntuación total se
obtiene sumando los valores de las frases seleccionadas, que van de 0 a 3.
El rango de la puntuación obtenida es de 0-63 puntos. Como otros instrumentos de

evaluación de síntomas, su objetivo es cuantificar la sintomatología, no proporcionar un
diagnóstico.
Los puntos de corte usualmente aceptados para graduar la intensidad/ severidad son los
siguientes:
No depresión: 0-9 puntos

Depresión leve: 10-18 puntos
Depresión moderada: 19-29 puntos
Depresión grave: > 30 puntos
A efectos de cribado o detección de casos en población general el punto de corte ha sido

establecido por Lasa L. y cols en > 13 puntos. En pacientes médicos la validez predictiva
de la escala está peor establecida, por cuento los ítems somáticos tienden a aumentar el
número de falsos positivos si se utiliza un punto de corte bajo y se han utilizado puntos de
corte más altos ( por ej.: > 16 en pacientes diabéticos, > 21en pacientes con dolor
crónico).
A efectos de selección de sujetos para investigación, el punto de corte usualmente

aceptado es > 21 puntos.
Cuestionario de Screning de ANSIEDAD de Wittchen.
DESCRIPCION:
Este cuestionario fue desarrollado por Wittchen y cols con el objeto de detectar trastornos
de ansiedad generalizada y otros trastornos de ansiedad.
Está basado en el Composite International Diagnostic Interview (CIDI). Su versión 1.2 se
desarrolló para cubrir criterios diagnósticos DSM-IV y ICD-10. Ha sido diseñado para su
uso en atención primaria.
El cuestionario consta de varias secciones:
1. Motivo de acudir a la consulta: es el ítem 1 y recoge una información útil para el
clínico (dolor, estrés emocional o psicológico, enfermedad física o somática...)

CARRERA PSICOLOGIA
2. Diagnósticos: ítems 2 a 7. Cada uno de ellos evalúa un diagnóstico distinto

mediante las llamadas cuestiones llave, que poseen una elevada sensibilidad
operativa para el diagnóstico de una patología.
3. La contestación negativa a estas cuestiones hacen casi imposible el diagnóstico
del cuadro explorado... Los diagnósticos evaluados son: trastorno depresivo
mayor, trastorno y síndrome de pánico, trastorno de ansiedad social, agorafobia,
trastorno de estrés postraumático y estrés agudo y trastorno de ansiedad
generalizada. Si la respuesta a estos seis ítems es negativa se finaliza la
cumplimentación del cuestionario.
4. Trastorno de ansiedad generalizada: evalúa tanto los criterios de ansiedad
generalizada como cuadros subclínicos de ansiedad, según los criterios DSM-IV,
completados con algunas cuestiones recogidas en CIE -10.
Valoran los siguientes aspectos.
 contenidos de las preocupaciones y ansiedad (ítems 8-10),
 dificultad para controlar las preocupaciones (ítems 11 y 12),
 síntomas físicos de ansiedad (ítem 13, que tiene 11 sub - ítem; los 6 primeros son
específicos de trastorno de ansiedad generalizada y los 5 siguientes
corresponden a los incluidos en CIE-10),
 impacto sobre la vida del paciente (ítem 14) y criterio temporal de duración de los
síntomas (ítem 15).
El marco temporal explorado es distinto para cada ítem. El cuestionario es auto
administrado. No se encuentra validado en nuestro medio y la versión que presentamos
es la de Bobes y cols.
INTERPRETACION:
Es un instrumento fácil y rápido de utilizar (en el estudio original de tiempo de
cumplimentación fue de 3.5 minutos), que no requiere entrenamiento especial.
La Sensibilidad y especificidad de las distintas cuestiones llave es la siguiente:
Trastornos de pánico (S 95% E 62%).
Agorafobia (S 88% E58%),
Fobia Social (S 89% E 51%,
Trastornos por estrés postraumático (S 82% E 49%),
Trastorno Depresivo Mayor (S 87% E 68%),
Trastornos de Ansiedad generalizada (cuestión llave más criterio, S 92% E 74%).
Respecto a los criterios de trastorno de ansiedad generalizada, los autores no proponen
ningún punto de corte. Cuantos más criterios se cumplan mayor posibilidades de
presencia del cuadro.
El cuestionario resulta útil tanto en cuadros de ansiedad establecidos como en
situaciones subclínicas.
PROPIEDADES PSICOMETRICAS:
Fiabilidad:
La fiabilidad tetst-retest para cuadros de ansiedad generalizada establecidos fue de
Kappa 0.72 y para ansiedad generalizada subclínica de 0.70.
Validez:
La validez concurrente se estableció con el CIDI, presentando valores de Kappa de 0.88
% , con Sensibilidad global de 88 y Especificidad de 96.3%. Cuando se analizan los
resultados con los criterios DSM-IV la sensibilidad es alta, pero la especificidad alcanza
solo valores moderados.
Instrumentos psicométricos de Personalidad
1. Para comprender el estudio de la personalidad nos vamos a apoyar en los
métodos destinados a apreciar “los rasgos del comportamiento” o las reacciones
individuales.
2. Son los denominados TEST de PERSONALIDAD, y que clasificamos en:

1. - LOS MÉTODOS o TEST PROYECTIVOS.
El test de Rorschach es el más representaativo de estos test. Pero por su

extensión y por estar fuera del objetivo de este Manual, descartamos

CARRERA PSICOLOGIA
desarrollarlo.
2. - LOS TEST OBJETIVOS de Personalidad.

Estos test intentan determinar los diferentes factores de la personalidad. Son
necesariamente validados según criterios exteriores a ellos mismos. Por
consiguiente corresponderán o bien a una sistematización nosológica de la
psiquiatria, o bien a una concepción estructuralista o incluso factorialista de
personalidad.
CLASIFICAMOS los test Objetivos en:
(A) los Test clásicos que miden los factores de personalidad como:
Inventario de personalidad de Minessotta (MMPI)

Factores de Personalidad (16 PF)
Cuestionario de Análisis Clínicos (CAQ).
Inventario de Personalidad de Pinillos (CEP)
Inventario de Personalidad de EYSENCK (EPI).
Todos ellos (el MMPI o el 16Pf, el CAQ, el EPI, o el CEP), nos permiten
diagnosticar trastornos de personalidad según criterios de las clasificaciones
psiquiátricas vigentes como el DSM o CIE.
Estos test (de los que comentaremos sus características, a groso modo) al estar
protegidos por copyright y comercializados por empresas especializadas, no se
incluirán en su totalidad.
(B) Test Específicos.
Hemos incluido, entre otros, los que miden aspectos específicos de
personalidad y que pueden ser útiles, en los CRC, son:
1) La Escala de Búsqueda de SENSACIONES, que mide este rasgo, se define

como “la necesidad de sensaciones y experiencias nuevas, variadas y complejas,
y el deseo de arriesgarse con el fin de obtenerlas”.
Se ha empleado en: Individuos con conductas inmaduras. En trastornos de
personalidadad, e incluso en individuos normales que realizan deportes de
riesgo.
2) El Test de Hostilidad de BUSS-DURKEE, que es uno de los cuestionarios

autoaplicados más empleados para medir la agresión, de especial utilidad para
evaluar impulsividad, intencionalidad suicida y agresión en general.
3) La Escala de Impulsividad de BARRAT. Es autoaplicado y uno delos más

utilizados en investigación. Está indicado en trastornos de personalidad
(especialmente límites), trastornos bipolares y todo trastorno psiquiátrico en que
la conducta impulsiva o suicida constituye un problema.
3. Test Específicos de Personalidad

Hemos incluido, entre otros, los que miden aspectos específicos de
personalidad y que pueden ser útiles, en los CRC, son:
1) La Escala de Búsqueda de SENSACIONES.
Esta escala mide este rasgo, se define como “la necesidad de sensaciones y
experiencias nuevas, variadas y complejas, y el deseo de arriesgarse con el fin
de obtenerlas”.
Se ha empleado en: Individuos con conductas inmaduras. En trastornos de
personalidadad, e incluso en individuos normales que realizan deportes de
riesgo.

CARRERA PSICOLOGIA
2) El Test de Hostilidad de BUSS-DURKEE.

Este, es uno de los cuestionarios autoaplicados más empleados para medir la
agresión, de especial utilidad para evaluar impulsividad, intencionalidad suicida y
agresión en general.
3) La Escala de Impulsividad de BARRAT.

Es una escala autoaplicado y uno de las más utilizadas en investigación. Está
indicado en trastornos de personalidad (especialmente límites), trastornos
bipolares y todo trastorno psiquiátrico en que la conducta impulsiva o suicida
constituye un problema.
4. ESCALA de BUSQUEDA de SENSACIONES.
DESCRIPCIÓN
La escala de búsqueda de sensaciones (Forma V), fue diseñada por Zuckerman

y col., siendo la versión más reciente la de 1978. Su objetivo es valorar la
búsqueda de sensaciones”. Este rasgo fue definido por Zúckerman como “la
necesidad de sensaciones y experiencias nuevas, variadas y complejas y el
deseo de arriesgarse con el fin de obtenerlas”.
Es un cuestionario autoadministrado, formado por 40 preguntas con respuestas
dicotómicas (Si – No). Cada respuesta afirmativa puntúa 1 y cada negativa 0.
CONSTA de 4 Escalas:
Búsqueda de Emociones (BEM): ítems 1.5.9.13.17.21.25.29.33.37

Búsqueda Excitación (BEX): ítems 2,6,10,14,18,22,26,30,34, 38
Desinhibición: ítems 3,7,11,15,19,23,27,31,35,39.
Susceptibilidad al aburrimiento (SAB):4,8,12,15,20,24,28,32,36,40
Proporciona por tanto 4 puntuaciones distintas (una por escala) y además una
total. En nuestro medio ha sido validada por Pérez y col., en base a trabajos
previos de este mismo autor.
INTERPRETACION.
Se trata de un instrumento adecuado para la investigación del rasgo “búsqueda
de sensaciones” en nuestro medio. No existen puntos de corte propuestos por los
autores y debe interpretarse que puntuaciones + elevadas representan mayor
presencia del rasgo.
Al igual que numerosos estudios, en la validación española se observan
puntuaciones más elevadas en todas las subescalas y la puntuación total en
varones respecto a las mujeres. En varones las puntuaciones más altas se
obtienen en la escala BEM y las menores en la SAB. En mujeres las más altas en
la BEM y las menores en la DES. Existe una relación inversa entre la edad y la
puntuación de la escala.
La subescala SAB es la menos homogénea, la que presenta menor correlación

con las otras y es la que menos fiabilidad alfa demuestra. La menor fiabilidad se
obtiene mediante la utilización de la puntuación total. En lugar de la de las
subescalas. A modo orientativo, presentamos los datos normativos en población
española
BEM BEX DES SAB TOTAL

Varones 6.8 (2,6) 5,7 (2,1) 5,1 (2,5) 3, ) ,3 (6,4)
Mujeres 6,1 (2,4) 5,4 (1,9) 3,0 (1,9) 3,0 (1,9) 17,7 ,3)

CARRERA PSICOLOGIA
PROPIEDADES PSICOMETRICAS.
Fiabilidad
La fiabilidad test- retest en la población española con un intervalo de 5 días es en

valores del 0,9 para la puntuación total y oscila entre 0,68 y 0,94 para las
subescalas. En las mujeres para la puntuación total es de 0,92 y entre 0,72 y 0,95
para las subescalas. El mismo caso anterior. Pero con un intervalo de 5 semanas
arroja valores similares en varones (0,88 para la puntuación total y 0,71 – 0,86
para las subescalas) y mujeres (0,78 para el total y 0,70 – 0,87 para las
subescalas).
Validez
La validez concurrente observada con las diferentes escalas
selEysencjPersonalityQuestionnaire son: Las Escalas E (Extraversión) y P
(Psicoticismo) presentan correlaciones superiores con la escala de Busqueda de
Sensaciones que la escala de N (Neuroticismo).
Instrumentos Psicométricos que nos permiten evaluar la Esquizofrenia y los

Trastornos Psicóticos
INTRODUCCION:
Desde la descripción de Demencia precoz por Kraepelin, que se considera el punto de
partida de la psiquiatría moderna, se han intentado identificar grupo de síntomas que
diagnostiquen de forma fiable este trastorno. De hecho, las clasificaciones psiquiátricas
DSM y CIE han intentado, en cada una de sus ediciones, afinar los criterios diagnósticos
en este sentido, sin conseguir acuerdos definitivos.En 1980 Crow y en 1982 Andreasen
defienden la existencia de 2 tipos de síntomas en la esquizofrenia: Positivos y
Negativos, con sus correlatos biológicos y de neuroimagen.
En 1987, Liddle revisa este modelo y sugiere uno tridimensional con las categorías de
Positivo-paranoide, Negativo-Deficitario y desorganizado y hefebrénico. En 1990, Kay y
Sevy proponen un modelo de 4 factores:: Positivo, Negativo, Agitación y Depresión.
Por último, Linstrom y Von Knorring entre otros autores, proponen un sistema
pentadimensional con las siguientes dimensiones: negativo, Positivo, Disfunción
cognitiva, Ansiedad / Depresión y Excitación. Todas estas propuestas cuentan con
estudios que poyan y con otras que los invalidan, y cualquier otra alternativa nosológica
resulta igualmente endeble.
En este momento se acepta que la esquizofrenia es un grupo hetereogéneo de
enfermedades cuya clasificación se encuentra en contínua revisión. La consecuencia es
que no hay un “patrón oro”, por lo que las escalas de evaluación , basadas en alguno de
los modelos descritos, se emplean para validar o rechazar dichos modelos,
produciéndose un error autológico metodológicamente inaceptable. Este problema casi
específico de la esquizofrenia, no parece que vaya a subsanarse en los próximos años,
por lo que va a implicar limitaciones importantes desde el punto de vista de la
Psicometría.
TIPOS DE ESCALAS:
Los principales aspectos que pueden evaluarse en la esquizofrenia son los siguientes:
1)Instrumentos para evaluar la PSICOSIS en general. Por las características
específicas de la Psicosis (la falta de conciencia de enfermedad en la mayoría de
estos enfermos), las escalas tienen que ser heteroevaluadas ya que el paciente
frecuentemente no va a colaborar.
Dentro de este grupo, la BPRS (ESCALA BREVE DE EVALUACION PSIQUIATRICA)
es no solamente la escala más utilizada con esta función, sino el test psiquiátrico
más empleado a nivel internacional junto a la escala de Hamilton de Depresión.
Inicialmente se empleó para monitorizar el tratamiento farmacológico en pacientes

CARRERA PSICOLOGIA
con Psicosis, utilidad en la que se considera de elección, pero poco después

empezó a emplearse en la evolución del síndrome Psicótico.
2) Instrumentos para la evaluación síntomas Positivos y Negativos. En este grupo, la
escala más empleada internacionalmente con diferencia es la PANSS, (ESCALA
SINDROME POSITIVO Y NEGATIVO EN ESQUIZOFRENIA), También es
heteroaplicada, basada en la BPRS y fundamentalmente en el modelo Crow. La
utilidad de esta escala ha motivado que se incluya en la Entrevista Clínica
Estructurada (CSID) que recomienda la Asociación Psiquiátrica Americana para
realizar los diagnósticos del DSM – III – R.
3) Instrumentos para la evaluación de otros aspectos relacionados con la
enfermedad.En este grupo, la escala más importante es la AIMS: (ESCALAS DE
MOVIMIENTOS INVOLUNTARIOS ANORMALES), que evalúa los efectos
extrapiramidales secundarios al tratamiento neuroléptico. Éstos efectos, constituyen
una de las principales limitaciones a la calidad de vida de estos enfermos y el
principal motivo de abandono del tratamiento.
La AIMS es la escala más empleada internacionalmente para medir este aspecto,
aunque no se encuentra validada en español.
Test de inteligencia:
Los Test de Inteligencia más que medir la inteligencia en sí (posibilidad muy discutible),
valoran los conocimientos, aptitudes y capacidades del individuo, por lo que se tiende
hoy a llamarlos test de aptitudes, de eficiencia o de rendimiento.
CONCEPTOS:
Conjunto de capacidades – razonamiento, memoria, asimilación, percepción, habilidades

numéricas, visualización espacial, rapidez mental, etc. – que pueden estar en un sujeto
en grados muy distintos. No es algo unitario sino una serie de cualidades que se miden
con pruebas diversas.
TIPOS DE TETS:
1. Individuales. (más fiables que los grupales).
2. Grupales. Autoadministrados, y de Realización.
3. Verbales:
OTIS, varias formas equivalentes destinadas a personas de distintos niveles

mentales. Permite formarse un juicio bastante aproximado sobre el nivel mental y
el desarrollo intelectual de los candidatos.
WECHSLER – BELLEVUE, para adultos. Consta de 11 pruebas.
WAIS, aprecia a través de las pruebas verbales, la inteligencia teórica y, a través

de las pruebas de ejecución, la inteligencia
4. Tests No Verbales:
Test D - 48, series de dominó
Matrices progresivas de RAVEN
PM – 38
Desarrollamos los que más nos puedan ayudar a la hora de valorar el Nivel o Coeficiente
de Inteligencia.

CARRERA PSICOLOGIA
ACTIVIDAD 07 y 08
Cualidades que debe tener un test psicométrico

Confiabilidad
La confiabilidad (o consistencia) de un test es la precisión con que el test mide lo que
mide, en una población determinada y en las condiciones normales de aplicación.
(Anastasi, 1982; Aiken, 1995). (Las condiciones normales de aplicación se refieren a las
condiciones especificadas en el manual del test).
La falta de confiabilidad de un test psicométrico esta en relación con la intervención del
error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados
de la medición que influye sobre la falta de confiabilidad de tal medición. El error es de
dos tipos: a) Error constante (sistemático), que se produce cuando las mediciones que se
obtienen con una escala son sistemáticamente mayores o menores que lo que realmente
deben ser. b) Error causal (al azar o no sistemático), que se produce cuando las medidas
son alternativamente mayores o menores de lo que realmente deben ser.
Este último tipo de error interviene cuando se afecta la confiabilidad de un test
psicométrico. Este error tiene que ver con la salud, fatiga, motivación, tensión emocional,
fluctuaciones de la memoria, condiciones externas de luz, humedad, ventilación, calor,
distracción por problemas del momento, familiaridad con la prueba, que presenta el
examinado al momento de dar el test (Rey, 1972; Brown, 1982).
¿Cómo se presenta la confiabilidad de un test psicométrico? La confiabilidad se presenta

por medio del coeficiente de confiabilidad (rxx) y del error estándar de medida (EEM).
Jaime Aliaga 93
A) Coeficiente de confiabilidad
Es un coeficiente de correlación entre dos grupos de puntajes e indica el grado en que los
individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1.
Cuanto más se acerque el coeficiente a 1, más confiable será la prueba. El coeficiente de
confiabilidad señala la cuantía en que las medidas del test están libres de errores
casuales o no sistemáticos.
Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas
de aplicación del test el 95% de la varianza de los puntajes directos se debe a la
auténtica medida, y sólo el 5%, a errores aleatorios.
Existen cuatro métodos básicos para obtener el coeficiente de confiabilidad (rxx): Método
de las formas equivalentes; método del test-retest; método de la división por mitades
emparejadas o "Split half method"; y método de la equivalencia racional o de Kuder-
Richardson.
a) Método de las formas equivalentes: Se aplican dos formas equivalentes o paralelas del
test al mismo grupo de individuos, y las dos series de puntajes resultantes se
correlacionan con el coeficiente producto de los momentos de Pearson (r).
b) Método del test-retest: Se aplica dos veces el mismo test (el lapso entre las
aplicaciones se determina previamente), a una misma muestra de individuos. Las dos
series de puntajes resultantes se correlacionan con el coeficiente de correlación "r" de
Pearson.
c) Método de la división por mitades emparejadas o "split half method": Se aplica el test
una sola vez a una muestra. Luego, se califica por separado los ítemes pares (2, 4, 6, ...,
n) y los ítemes impares (1, 3, 5, ..., n). A continuación, las dos series de puntajes
resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido
el test en dos partes (ítemes pares e ítemes
impares), el "r" resultante debe ser "corregido" para arrojar el "r" para todo el test. Esta
corrección se efectúa con la fórmula de profecía de Spearman-Brown:
d) Método de la equivalencia racional: En este método se considera que si un test esta
formado por un conjunto de ítemes estos pueden ser considerados como un conjunto de

CARRERA PSICOLOGIA
tests paralelos (tantos como ítemes tenga el test). Luego se deriva una ecuación para
computar el coeficiente de confiabilidad. Kuder y Richardson
derivaron varias fórmulas para el cálculo del coeficiente de 94 Psicometría
confiabilidad, son las más conocidas la KR20 y la KR21. Actualmente, un coeficiente más
utilizado es el coeficiente alfa de Cronbach
(1972; Anastasi, 1982; Aiken, 1995).
B) Error estándar de medida

Por medio de este error estándar de medida se estima el intervalo probable de puntajes
en el cual se encontrará el puntaje verdadero de un sujeto examinado con un test
psicométrico. El error estándar de medida (EEM) se obtiene a través de la siguiente
fórmula:
EEM = s 1- rxx
Donde:
s = Desviación estándar de los puntajes de la distribución.
rxx = Coeficiente de confiabilidad del test.
1 = Constante.
Obtenido el EEM, debemos escoger el nivel de confianza:
- Nivel de confianza del 68% = PD ± 1 EEM.
- Nivel de confianza del 95% = PD ± 2 EEM.
Para el nivel de confianza del 68% la interpretación es la siguiente: "Podemos concluir,
con un 68% de confianza, que el puntaje verdadero de un sujeto está en la zona o
intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1 EEM".
El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de
un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo
(PD) y ± 2 EEM".
Validez
Si tenemos una prueba “X” nos equivocaríamos al creer que su titulo nos dice lo que la
prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a
obtener una medida, por ejemplo, de razonamiento numérico o de las estrategias de
aprendizaje. La averiguación de lo que la prueba mide no responde a la pregunta ¿cómo
llama el autor a la prueba?, sino más bien ¿a qué hacen referencia los puntajes obtenidos
en esta?, ¿es válido el uso o la interpretación de las puntuaciones de este test?, ¿qué
generalizaciones se pueden hacer apropiadamente a partir de la puntuación en esta
prueba? (Thorndike, 1989). En esencia, el trasfondo de estas preguntas es determinar
cuáles son los procesos mentales que pone en juego el test. Ahora bien, el responder a
las Jaime Aliaga 95 citadas interrogantes necesita de una indagación larga y compleja
que en psicometría se denomina proceso de validación.
a) Distinción entre la validez y la confiabilidad según el error.

La distinción entre confiabilidad y validez se basa en lo que consideramos como error. En
la validez interesan los errores constantes o sistemáticos y en la confiabilidad los errores
aleatorios o no sistemáticos. El siguiente ejemplo nos permitirá precisar la diferencia
entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se
trata de un buen cronometro el tiempo
que marca será confiable (es decir consecuente), pero no será valido en comparación
con el tiempo estándar (hora GMT).
b) Definición de validez.
En términos estadísticos la validez se define como la proporción de la varianza
verdadera que es relevante para los fines del examen. Con el término relevante nos
referimos a lo que es atribuible a la variable, características o dimensión que mide la
prueba. En este sentido, generalmente la validez de un test se define ya sea por medio
de (1) la relación entre sus puntuaciones con alguna medida de criterio externo, o bien (2)
la extensión con la que la prueba mide un rasgo subyacente específico hipotético o
“constructo”.

CARRERA PSICOLOGIA
En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso

evolutivo, desde aquella posición que sostenía que “un test es válido para aquello con lo
que correlaciona” (Guilford, 1946, citado en Muñiz, 1996, p. 52), hasta la más reciente
que la entiende como un juicio evaluativo global en que la evidencia empírica y los
supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y
acciones en base a los puntajes de las pruebas, que son función no sólo de los ítemes
sino también de la forma de responder de las personas así como del contexto de la
evaluación. Es decir, lo que se valida no es la prueba sino las inferencias hechas a partir
de la misma, lo que tiene dos importantes consecuencias: a) el responsable de la validez
de una prueba ya no es solo su constructor sino también el usuario, y b) la validez de una
prueba no se establece de una vez por todas sino que es resultado del acopio de
evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo que
comprende todas las cuestiones 96 Psicometría experimentales, estadísticas y filosóficas
por medio de las cuales se evalúan las hipótesis y teorías científicas (Messick, 1995). En
este contexto, el concepto validez refiere a la adecuación, significado y utilidad de las
inferencias específicas hechas con las puntuaciones del los tests. La validación de un test
es el proceso de acumular evidencia para apoyar tales inferencias. Una variedad de
evidencias pueden obtenerse de las puntuaciones producidas por un test dado, y hay
muchas formas de acumular evidencia para apoyar una inferencia específica. La validez,
sin embargo, es un proceso unitario. Aunque la evidencia puede ser acumulada de
muchas formas, la validez se refiere siempre al grado en que esa evidencia apoya las
inferencias que se hacen a partir de las puntuaciones” (APA, AERA, NCME, 1985, citado
en Gómez e Hidalgo, 2002). La validez no se puede resumir en un solo indicador o índice
numérico, al igual que ocurre con la confiabilidad (p.e., el coeficiente de confiabilidad),
sino que la validez de las puntuaciones de un test se asegura mediante la acumulación
de evidencia teórica, estadística, empírica y conceptual del uso de las puntuaciones.
c) Tipos de evidencia. En 1954 un comité presidido por L. J. Cronbach estableció por

encargo de la Asociación de Psicología Americana (APA), que la validez era de cuatro
tipos: validez de contenido, validez predictiva, validez concurrente y validez de
constructo. Actualmente se coincide, desde el punto de vista científico, que la única
validez admisible es la validez de constructo
(Messick, 1995). Validación que ha de hacerse en un marco teórico, pues se trata en
última instancia de confirmar o explicar las inferencias que se hagan de los puntajes. La
validez de constructo esta referida al grado en que cada prueba refleja el constructo que
dice medir, elaborándose operativamente cuando el usuario desea hacer inferencias
acerca de conductas o atributos que pueden agruparse bajo la etiqueta de un constructo
particular. Su lógica en muchos aspectos así como en sus métodos, es esencialmente la
del método científico, pudiendo verse como la elaboración de una “miniteoría” acerca de
una prueba (Kline, 1985) cuyas hipótesis deben someterse a contraste con evidencias
que provengan de diferentes fuentes como la de los tipos de validez propuestos por
Cronbach, entendidas como estrategias de validación, en vista que cada tipo de
inferencia requerirá una Jaime Aliaga 97 estrategia distinta para la obtención de las
evidencias (Vidal, 1996, en Muñiz, 1996).
En el estudio de la validez de constructo estas evidencias están relacionadas a cinco
aspectos:
a) Contenido (relevancia y representatividad del test);
b) Sustantivo (razones teóricas de la consistencia observada de las respuestas);
c) Estructural(configuración interna del test y dimensionalidad);
d) Generalización (grado en que las inferencias hechas a partir del test se pueden
generalizar a otras poblaciones, situaciones o tareas); e) Externo (relaciones del test con
otros tests y constructos); f) Consecuencia (consecuencias éticas y sociales del test)
(Messick, 1995).
d) Categorías de la validez. La validez empieza a considerarse como el grado en que

cada test refleja el constructo que dice medir y que las relaciones entre tests que miden
distintos constructos reflejan las relaciones hipotetizadas entre ellos. En este sentido, al

CARRERA PSICOLOGIA
estimarse que la validez de un test es la validez de constructo la que ha de hacerse en un

marco teórico, ya no se tiende a hablar de tipos de validez sino de categorías o
estrategias de validación comprendiendo éstas a los tipos tradicionales de validez:
validez de contenido, validez empírica y validez de constructo. Si tenemos en cuenta que
lo que se valida no es el test sino las inferencias hechas a partir del mismo, cada tipo de
inferencia requerirá una estrategia distinta. (Vidal, 1996, en Muñiz, 1996).
(1) Validez de Contenido (evidencia del contenido).- ¿Los ítems que constituyen el test
son realmente una muestra representativa del dominio de contenido o dominio conductual
que nos interesa?
Es conveniente precisar que un dominio o campo conductual es una agrupación
hipotética de todos los reactivos posibles que cubren un área psicológica particular. Al
hablar de este conjunto de reactivos posibles, se emplean los términos de dominio,
universo o población conductual como sinónimos. Por ejemplo: Un test de vocabulario
debe ser una muestra adecuada del dominio o universo de ítems posibles en esta área.
La validez de contenido consiste en determinar lo adecuado del muestreo de reactivos
del universo de reactivos posibles; en este sentido, es una “medida” de lo adecuado del
muestreo. Ponemos “medida” entre comillas debido a que este tipo de validez consiste en
98 Psicometría una serie de estimaciones u opiniones, que no proporcionan un índice
cuantitativo de validez (para su obtención no se utiliza procedimientos estadísticos). Este
tipo de validez se asocia fundamentalmente a los tests de aprovechamiento o rendimiento
(test
de matemática, historia, etcétera); aunque no existen razones para que no pueda
aplicarse a los otros tipos de pruebas psicológicas (pruebas de aptitudes, habilidades,
etcétera). Para su determinación se compara sistemáticamente los reactivos del test con
el dominio conductual del contenido postulado. Por ejemplo: si tenemos una lista de 500
palabras que esperamos que los estudiantes de un curso sean capaces de escribirlas
correctamente al final de este, su performance o rendimiento respecto a estas palabras
será importante solamente en tanto que proporciona una prueba de su habilidad para
escribir correctamente las 500 palabras. El test que construyamos tendrá una muestra de
las 500 palabras, pero sólo tendrá validez de contenido en la medida en que proporcione
una muestra adecuada de las 500 palabras que represente. Si seleccionamos solamente
palabras fáciles o difíciles, o palabras que representen únicamente ciertos tipos de faltas
comunes de ortografía, estaríamos propensos a obtener una validez de contenido muy
baja. En consecuencia, el aspecto clave en la validez de contenido es el muestreo de los
reactivos. En otras palabras, la validez de contenido es cuestión de determinar si la
muestra de sus reactivos es representativa del universo o dominio conductual de ítems al
que supuestamente representa. Para hacer esta determinación se recurre a “jueces” (o
expertos, generalmente en número impar). El proceso es básicamente lógico y racional,
los distintos jueces pueden no estar de acuerdo en la validez de contenido de un test; por
ejemplo, la falta de claridad en la especificidad del dominio conductual, hará que resulten
difíciles los juicios de validez de contenido. Existen algunos índices estadísticos para
valorar el grado de acuerdo de los jueces en torno a los reactivos, por ejemplo el
coeficiente V de Aiken. Un procedimiento para que el proceso de “enjuiciamiento” de los
reactivos sea lo más objetivo posible, es el siguiente:
- El constructor de la prueba:
* Define específicamente el dominio del contenido por medio de una descripción que lo
debe delimitar claramente. Jaime Aliaga 99
* Define, si fuera necesario, subcategorías importantes del dominio, especificando esta
importancia en términos porcentuales.
- Los jueces:
* Determinan si los reactivos sometidos a su consideración pertenecen o no al dominio
definido así como también si, tomados en conjunto, tienen una proporción adecuada.
* También enjuician la bondad de la redacción de los
elementos. Es usual considerar en los tests de aprovechamiento escolar a este tipo de
validez como un concepto similar al de validez curricular. Por otro lado, es necesario
diferenciar la validez de contenido de la llamada validez de facie. Esta última se da

CARRERA PSICOLOGIA
cuando se revisa superficialmente los reactivos y se consideran que los ítems “parece”
que miden lo que se supone tienen que medir. Esta validez puede ser una consideración
importante a tener en cuenta, si la “apariencia” de los ítems influye en la motivación del
sujeto. Por ejemplo, si en un test para adultos se incluyen reactivos en lenguaje y
contenido infantil, se dirá que este test no tiene validez de facie; el sujeto puede no
sentirse motivado a obtener buenos resultados al sentir que la prueba es poco importante
para la decisión que se va a tomar.
(2) Validez Predictiva (evidencia externa) - ¿Predicen las puntuaciones del test un
rendimiento o conducta futura? (Junto con la validez concurrente se le denomina también
validez empírica del test).
Un uso común de los tests es predecir la conducta futura; utilizamos el test para
ayudarnos a tomar alguna decisión práctica (selección, clasificación, etc.). En cada una
de estas situaciones, cuanto mayor es la exactitud de predicción del resultado (es decir
del criterio externo), tanto más útil será la prueba. Por ejemplo, el test será un
componente aceptable de un proceso de selección de
personal, si sus calificaciones o puntuaciones predicen la ejecución de algún componente
importante del trabajo (criterio externo); en otras palabras, para que el test se pueda
utilizar como parte de un proceso de selección es preciso demostrar la validez de la
prueba relacionándola con los criterios pertinentes. En este sentido, el contenido de la
prueba pasa a tener un lugar secundario, siendo el interés fundamental del psicólogo el
averiguar si el test predice un criterio determinado. 100 Psicometría Para este logro es
necesario que los criterios externos con los cuales se relacionará las puntuaciones del
test sean criterios validos y confiables.
Un criterio es cualquier desempeño que los sujetos tienen en la vida real, por ejemplo, las
medidas de rendimiento académico, medidas de rendimiento laboral, clasificaciones
psiquiátricas, etcétera. En muchos casos resulta imposible hallar un criterio no ambiguo
de un rasgo mental. Por ejemplo, dos psicólogos, Carla y Abel, que investigan el rasgo de
aptitud numérica pueden emplear diferentes criterios externos para correlacionar los
puntajes del test que han creado. Así, Carla puede considerar que el criterio externo más
adecuado son las calificaciones que reciben los sujetos en un curso de mecánica en
taller; mientras que Abel puede considerar como criterio el periodo de tiempo que gastan
los estudiantes en aprender una tarea mecánica y sencilla durante el entrenamiento en
un fabrica. ¿Qué sucede si las pruebas que emplean ambos psicólogos correlacionan
0.006 con uno de los criterios, y 0.70 con el otro?, ¿cómo podemos afirmar que la prueba
es valida cuando arrojan resultados de cierta clase?, ¿se trata en verdad de una prueba
de aptitud mecánica? En razón a situaciones como esta se llego a la conclusión de que la
validación de un test es un proceso largo y no un hecho aislado. Solamente a través de
estudios de correlación con una amplia variedad de criterios podremos comprender que
mide la prueba. Así, una serie de investigaciones sobre la “prueba de actitud mecánica”
nos puede demostrar que en realidad esta midiendo la habilidad para realizar
movimientos fino y cuidadosamente controlados, siendo completamente independiente
para comprender las reacciones complejas de la piezas mecánicas. De esta manera el
test puede tener una alta correlación con las calificaciones obtenidas en el taller y
ninguna con los trabajos e maquinarias. En el proceso de validación, la validez predictiva
de un test (y también la concurrente) se expresa generalmente por medio de un
coeficiente de correlación entre los puntajes y los denominados criterios. Este coeficiente
se denomina coeficiente de validación. La interpretación de este coeficiente requiere un
dominio excelente del análisis estadístico utilizado para obtenerlo. Después del criterio,
los procedimientos estadísticos adquieren vital importancia para obtener esta categoría
de validez. Incluso para un mejor análisis es conveniente contar con el dispersigrama o
scatergrama o “nube de Jaime Aliaga 101 puntos” (gráfica del coeficiente de correlación
entre las puntuaciones del test “X” y las del criterio “Y”).
(3) Validez Concurrente.- ¿Permiten las puntuaciones del test la valoración de ciertos
hechos presentes? Para estimarla se administra el test y se le correlaciona con el criterio.
La diferencia con la validez predictiva se da en dos aspectos: a) las medidas del test y del

CARRERA PSICOLOGIA
criterio son obtenidas contemporáneamente, y b) en su uso principal. Respecto a esto

último, se la utiliza principalmente para obtener tests como sustitutos de otros
procedimientos menos convenientes por diversas razones. Ejemplos: un test de
inteligencia colectiva se compara con uno de inteligencia individual. Los diagnósticos de
lesiones cerebrales basados en el test de diseños de bloques (cubos de Kohs) se
comparan con síntomas neurológicos. El problema principal de este tipo de validez es
encontrar tests que sirvan como criterios válidos y confiables. Análogamente a la validez
predictiva requiere un amplio domino de las técnicas de correlación y de los
procedimientos estadísticos que se utilizan en su obtención. Junto con la validez
predictiva es importante en ciertos problemas de psicología aplicada como en psicología
clínica, psicología educacional, psicología industrial y en general, en la toma de
decisiones que debe hacer el psicólogo en situaciones de selección, clasificación,
hospitalización, etc.
(4) Validez de Constructo.- El constructo viene a ser un concepto hipotético que forma
parte de las teorías que intentan explicar la conducta humana: inteligencia, creatividad,
dependencia de campo, etc. La validez de constructo es la obtención de evidencias que
apoyan que las conductas observadas en un test son (algunos) indicadores del
constructo. Este tipo de validez responde a la
pregunta "¿cómo se puede explicar psicológicamente la puntuación del test?". La
respuesta a esta pregunta puede verse como la elaboración de una “miniteoría” acerca
de una prueba psicológica. La lógica de la validez de constructo en muchos aspectos así
como en sus métodos, es esencialmente la del método científico. El proceso de
validación de constructo implica a partir del
establecimiento de deducciones de la teoría:
a) Formular hipótesis y relaciones entre elementos del constructo, de éste con otros
constructos de la teoría y con otros constructos externos. 102 Psicometría
b) Seleccionar ítemes o tests (indicadores) que representen manifestaciones concretas
del constructo.
c) Recogida de datos.
d)Establecer consistencia entre datos e hipótesis, y examinar el grado en que los datos
podrían explicarse mediante hipótesis alternativas.
Hay diversos procedimientos para establecer la validez de constructo. Si elaboramos una
“miniteoría” esta tendrá tres pasos: (1) en base a la teoría sostenida en ese momento
respecto del test, el psicólogo deduce ciertas hipótesis sobre la conducta esperada de las
personas que obtienen puntajes diferentes en el test, (2) se reúne datos que confirman o
no esas hipótesis, (3) en base a los datos acumulados, se toma la decisión relativa a si la
teoría explica adecuadamente los datos. Si no es así se tiene que revisar la teoría y
repetir el proceso hasta lograr una explicación más adecuada. El proceso de validación,
en ese sentido, es de continua reformulación y refinamiento.
Al determinar la validez de construcción, el propósito es identificar todos los factores que
influyen en la ejecución del test y determinar el grado que influyen cada uno de ellos.
Ejemplo: Un psicólogo construye un test de ansiedad y elabora una “microteoría” cuya
contrastación le dirá si el test tiene validez de constructo. Las hipótesis a verificar son las
siguientes:
1. Los que obtienen puntuaciones elevadas acabarán probablemente en clínicas
psiquiátricas en comparación con aquellos de puntuaciones más bajas.
2. Será más fácil que les receten drogas psicotrópicas a los que tienen altas
puntuaciones que a los de bajos puntajes.
3. Los hijos de los de puntuaciones altas tendrán mayores probabilidades de tener una
puntuación alta en el test que los hijos de quienes tuvieron puntuaciones bajas.
4. El test de ansiedad se correlacionará alta y significativamente (más allá de 0.60) con
otros test de ansiedad.
5. El test de ansiedad no se correlacionará con variables que no resulten conexas con la
misma.
6. Los grupos psiquiátricos caracterizados como ansiosos alcanzarán en el test unas
puntuaciones más altas que los del grupo control. Jaime Aliaga 103

CARRERA PSICOLOGIA
7. En el test de ansiedad, los sujetos evaluados por supervisores y colegas como

ansiosos, lograrán mayores puntuaciones que quienes están considerados como no
ansiosos (Kline, 1985).
Los resultados de los estudios que hagamos realmente no “validan” o “prueban” la teoría
completa, puesto que nunca se puede demostrar una “construcción” en forma absoluta;
solamente se puede aceptar como la mejor definición de trabajo. Si los resultados son
negativos, hay por lo menos tres interpretaciones posibles: a) la prueba puede no medir
el “constructo”, b) el marco teórico puede ser erróneo, permitiendo que se hicieran
inferencias incorrectas, o bien
c) quizá, el diseño del experimento no permitía una prueba apropiada de la hipótesis. La
falla del diseño suele ser la falla más fácil de detectar, pero no siempre se puede hallar
con facilidad el lugar exacto de la falla. La interpretación ambigua de los resultados
negativos es un inconveniente evidente del procedimiento de validación de los
“constructos” (Crombach, 1972; Kline, 1985).
e) Implicaciones prácticas en la validación de un test. El psicólogo que utiliza un test debe
tener en cuenta lo siguiente: a) antes de tomar de decisiones sobre individuos o grupos,
debe acumular toda la información disponible acerca del test; b) para la predicción o
selección, el test debe estar validado en la situación específica donde se va utilizar; c) en
cualquier situación, el psicólogo debe tener presente que nuestras ideas sobre la
naturaleza de los rasgos y sobre todo lo que miden se modifica constantemente con
nueva información hacer
MÉTODOS EMPLEADOS PARA ESTIMAR LA VALIDEZ

DE CONSTRUCCIÓN
a) Métodos intrapruebas, cuyas fuentes de evidencia más usadas son: la validez de
contenido de la prueba, el análisis de los procesos psicológicos empleados al responderla
(p. e., pidiendo que los sujetos “razonen” en voz alta sus respuestas). Otras técnicas
estudian la estructura interna de la prueba, mediante el análisis de los ítemes y las
correlaciones entre los diferentes subtests; asimismo, también mediante el
establecimiento de la homogeneidad a través del coeficiente alfa de Cronbach o los
coeficientes de Kuder-Richardson (que contribuyen a evaluar la unidimensionalidad del
test).
b) Métodos interpruebas: Utilizan las técnicas del análisis factorial (para evaluar los
factores que subyacen en las intercorrelaciones de las 104 Psicometría pruebas
estudiadas), la validez congruente (en tanto correlaciona los puntajes de la prueba con
los puntajes obtenidos en otra prueba de validez ya establecida), los estudios de validez
convergente y divergentediscriminante
(propuestos por Campbell).
c) El método de los estudios relacionados con los criterios: Que implican la diferenciación
de grupos (evaluando la capacidad de la prueba para poder diferenciar dos o más grupos
naturalmente separados o diseñados experimentalmente) y los coeficientes de validez
(cuando la prueba es aplicada a un grupo de sujetos en los que se estudian criterios
relacionados con el constructo teórico estudiado).
d) El método de la manipulación experimental: Se manipula experimentalmente una
variable y se observa sus efectos sobre los puntajes de una prueba psicológica o la
relación de estos puntajes con algún criterio.
e) El método de los estudios de la capacidad de generalización: Estos estudios analizan
sistemáticamente la prueba psicológica en una amplia gama de dimensiones o en
condiciones diferentes de administración (p. e., la matriz multirasgo-multimétodo
propuesta por Campbell y Fiske).
Teoría de respuesta al ítem (TRI)
Llamada también Teoría del Rasgo Latente, es un modelo probabilístico que permite
conocer la información proporcionada por cada ítem, y así crear tests individualizados, es
decir, a medida. Es un modelo complejo que se ha popularizado como modelo de Rasch
(1980) (aunque específicamente el modelo de Rasch es un parámetro de la dificultad del
ítem), pero existe también el modelo de dos parámetros, que tiene en cuenta también la
discriminación o pendiente de la curva, y el de tres parámetros que tiene en cuenta el

CARRERA PSICOLOGIA
factor azar en la respuesta a ítemes de alternativas múltiples (Cortada de Kohan, 1999).

La diferencia principal entre el modelo de la Teoría Clásica de los Test y este modelo es
que la relación entre el puntaje observado y el rasgo o la aptitud en la teoría clásica es de
tipo lineal (PD = PV + e: puntaje directo del sujeto es igual a su puntaje verdadero más el
error); mientras que en los diversos modelos de la TRI las relaciones son funciones de
tipo exponencial, principalmente logísticos. Los postulados básicos de la TRI son:
1) El resultado de un examinado en un ítem puede ser explicado por un conjunto de
factores llamados rasgos o aptitudes simbolizados por q.
Jaime Aliaga 105
2) La relación entre la respuesta a un ítem y el rasgo latente se describe como una
función monotónica creciente que es la curva característica del ítem.
3) En la TRI los parámetros de aptitud y de los ítemes soninvariantes.
Los supuestos de la TRI son:
1) La unidimensionalidad del rasgo latente, es decir, que los ítemes de un test deben
medir una sola aptitud o rasgo; y
2) La independencia, es decir, que las respuestas de un examinado a cualquier par de
ítemes son independientes. Para estimar los parámetros de la TRI se usa el método de
máxima verosimilitud, que es un proceso complejo que se logra con los softwares
apropiados como BILOG, BICAL, y otros. (Cortada de
Kohan, 1998).
CONCLUSIONES
1) La psicometría es una disciplina de la psicología cuya finalidad intrínseca es la de
aportar soluciones al problema de la medida en cualquier proceso de investigación
psicológica; constituye, por ello, un campo metodológico que incluye teorías, métodos y
usos de la medición psicológica, tanto a nivel teórico como a nivel práctico.
2) En psicología, medir es dar la magnitud de cierta propiedad o atributo, por ejemplo, la
inteligencia, la extraversión, el razonamiento verbal, de una o más personas, con ayuda
del sistema numérico.
3) El test psicométrico es un procedimiento estandarizado compuesto por ítemes
seleccionados y organizados, concebidos para provocar en el individuo ciertas reacciones
registrables; reacciones de toda naturaleza en cuanto a su complejidad, duración, forma,
expresión y significado.
4) Los requisitos de un test psicométrico son: Construcción del test; la situación de
aplicación del test; el registro del comportamiento provocado en el sujeto examinado, que
debe ser preciso y objetivo; el comportamiento registrado evaluado estadísticamente con
respecto a un grupo de individuos denominado
grupo de referencia o grupo normativo; clasificación de los sujetos examinados en función
de normas resultantes del examen previo del grupo de referencia o normativo (baremo),
lo que permite situar cada 106 Psicometría una de las respuestas, en una distribución
estadística (contraste);.las respuestas a las cuestiones planteadas deben dar una medida
correcta del comportamiento al que el test apunta (validez); y por último, la repetición del
examen debe conducir siempre al mismo resultado (fiabilidad).
5) La estandarización es el proceso mediante el cual se establecen procedimientos
unívocos para la aplicación, calificación e interpretación de un test psicométrico.
6) La interpretación de los puntajes de un test psicométrico estandarizado se refiere al
significado que se les da a los puntajes obtenidos por un grupo de sujetos, al compararlos
con una tabla de normas o baremo, estableciendo una clasificación de acuerdo a la
conversión de sus puntajes directos en puntajes percentiles, eneatipos o decatipos.
7) Los tests psicométricos se clasifican por lo siguiente: Por su forma de dar las
instrucciones; por su forma de administración; por la forma o tipo de respuesta que
exigen; por el material de la prueba; por su forma de calificación; por sus edades límites
de aplicación; y por su libertad de ejecución. En los test psicométricos utilizados en
educación existe actualmente un tipo de tests denominado test relacionado con el criterio.
8) El test psicométrico es empleado como instrumento auxiliar para una mejor toma de
decisiones: En la selección, clasificación, diagnóstico, investigación, y evaluación de un
determinado grupo de personas.

CARRERA PSICOLOGIA
9) Entre las limitaciones en el uso de un test psicométrico tenemos: Una prueba o test
sólo puede medir aquellos aspectos para los que ha sido construido; las normas (baremo)
de una prueba no tienen validez universal; si las condiciones que influyen sobre el
individuo se modifican, existe la posibilidad de que tales cambios durante la aplicación de
la prueba influyan en los puntajes resultantes
del test; los resultados de un test no deben emplearse para diagnosticar per se estados
patológicos;.y, finalmente, las categorías descriptivas (inteligencia muy superior, superior,
etc.) sólo deben utilizarse para los tests cuyos puntajes le dieron origen.
10) Un test psicométrico tiene generalmente las siguientes secciones o partes: El test
propiamente dicho, y el manual del test.
11) Entre las cualidades que debe tener un test psicométrico, hay que tener en cuenta: la
confiabilidad, que puede estimarse a Jaime Aliaga 107
través de dos procedimientos: el coeficiente de confiabilidad y el error estándar de
medida (EEM); y la validez, que es el grado en que una prueba mide lo que intenta medir.
12) La validez científica de un test la da la validez de constructo. La tendencia ya no es
hablar de tipo de validez, sino de categorías de validez en la que la validez de contenido,
validez predictiva, validez concurrente y validez de constructo reconstituyen en
estrategias de validación.
13) La teoría de respuesta al ítem (TRI), denominada también Teoría del Rasgo Latente,
es un modelo probabilístico que permite conocer la información proporcionada por cada
ítem, y así crear tests individualizados, es decir, a medida. Los supuestos de la TRI son:
la unidimensionalidad del rasgo latente; y la independencia, es decir, que las respuestas
de un examinado a cualquier par de ítemes son independientes.

CARRERA PSICOLOGIA
Actividad 10 y 11
MEDICION Y EVALUACION
Medición: medida interpretada que es implícita a la medición de un test.
Objetiva: método y procedimiento en la administración de un instrumento sin influencia
de factor externo; que al ser repetida en igualdad de circunstancias los resultados deben
ser iguales.
Tipificada: debe ser aplicable a una población diferenciada por ciertas características.
Muestra de conducta : es muestra ya que ningún tipo de comportamiento es posible de
medir completamente, lo que hacemos es aproximarnos a su medición a través de una
muestra.
MEDICIÓN: Consiste en reglas para asignar símbolos a objetos de manera que:
1. Representen numéricamente cantidades de atributos (escalas de medida).
2. Definan si los objetos caen en las mismas categorías o en diferentes con respecto a un
atributo determinado (clasificación).
Tanto las escalas de medición como la clasificación implican la formulación y evaluación
de reglas. Estas reglas son usadas para medir atributos de los objetos, por lo general,
pero no de manera exclusiva, sino también de personas. Es importante recordar que
podemos medir sólo atributos de los objetos, no a los objetos mismos. Entre las
características de las buenas reglas están la receptibilidad (confiabilidad) y de modo más
importante, la validez en los sentidos que se describan. La estandarización es un objetivo
importante de la medición debido a que facilita la objetividad, cuantificación,
comunicación, economía y generalización científica.
La medición usa matemáticas, pero las dos sirven a papeles separados. La medición
necesita relacionarse con el mundo físico, pero las matemáticas puras sólo se ocupan de
la consistencia lógica. Un aspecto tradicionalmente importante, pero controvertido de las
escales de medición, es que estas por lo general caen en uno de cuatro niveles (han sido
sugeridos otros); nominal, ordinal, de intervalos y de razón. Estos cuatro niveles
representan de manera progresiva reglas mejor articuladas, por ejemplo, las escalas
nominales tan sólo definen si dos (2) objetos son equivalentes o no, entre sí, con
respecto a un atributo crítico, pero las escalas ordinales determinan si un objeto que no
es equivalente a otro es mayor o menor que el otro; son posibles resultados más
consistentes con niveles superiores de medición. El concepto de invarianza es básico
para estos niveles de medición, el cual tiene que ver con lo que permanece igual cuando
se realizan cambios permisibles en la escala. Las escalas de niveles superiores están
más restringidas en cuanto a la manera en que pueden ser transformadas y aún
conservar invarianzas claves.
ESCALAS DE MEDICIÓN.
Stevens propuso que las mediciones entran en cuatro (4) clases principales de escala de
medición (nominal, ordinal, de intervalo y de razón), las cuales permitieron que se
ejecutaran en las medidas, procedimientos cuantitativos cada vez más complicados, pero
a su vez demandaron cada vez más de las operaciones de medición.
Escalas de Medición:
* Nominal: contiene reglas para decidir si dos (2) objetos son equivalentes o no para una
categorización. El resultado de una escala nominal, es una serie de clases, a las cuales
podría darse una designación numérica. Es importante distinguir entre usar categorías
"Nombres" lo cual es impropio y la categoría "Frecuencias" la cual es bastante apropiada.
* Ordinal: contiene reglas para decidir si un objeto es diferente a otro es mayor o menor
con respecto a un atributo determinado.
* De Intervalo: relfejan operaciones que definen una unidad de medición; así como
mayor, igual o menor.
* De Razón: es una escala de intervalo con un cero (0) racional (verdadero), en lugar de
un cero (0) arbitrario. Un cero (0) racional significa la ausencia del atributo y no
simplemente razonable.

CARRERA PSICOLOGIA
AREAS DE APLICACIÓN DE LOS TEST PSICOMÉTRICOS:

Dentro de las áreas aplicadas de la psicología el uso de test es fundamental en las
siguientes:
 PSICOLOGÍA CLÍNICA: quizás la más popularmente relacionada con el uso de tests, ya
sea para la práctica privada o institucional, los tests le permiten al clínico tener una
mayor cantidad de información del individuo en un menor tiempo así como acceder a
elementos dificilmente alcanzables por otros métodos, así como también
proporcionan un paneo con respecto a la forma de funcionamiento predominante en el
paciente en determinadas áreas lo que cotribuye tanto al proceso de diagnóstico y
despistaje, como al momento de planificar determinada intervención, remisión a otros
profesionales o incluso al inicio de un proceso de psicoterapia.
 PSICOLOGÍA EDUCATIVA Y ORIENTACIÓN VOCACIONAL : en esta área permite evaluar de
una forma estandarizada, relativamente sencilla y muy enriquecedora, los procesos
de niños, adolescentes o adultos relacionados con el aprendizaje y las posibles
dificultades que se puedan presentar en éste, también es fundamental en las
asesorías de elección vocacional, pues permiten visualizar las capacidades, aptitudes
y preferencias que la persona posee pero que realmente no es capaz aún de
identificar y de eleborar por sí mismo.
 PSICOLOGÍA ORGANIZACIONAL Y LABORAL: al igual que en las áreas anteriores, permite
acceder a una gran cantidad de información en un tiempo mínimo, permite despistar
trastornos mentales mayores, identificar actitudes, potencialidades y debilidades y
aplicar este perfil en el proceso de selección de personal para un cargo determinado.
COMPONENTES DE LOS TEST
MANUAL TÉCNICO DE DESCRIPTORES DEL TEST
 Descripción del test (¿para qué sirve?, autor, año de publicación, cómo se
comercializa).
 Desarrollo de las escalas (qué pasos siguió para elaborar los ítems, tareas, qué
modificaciones se han dado, criterios seguidos paras las modificaciones)
 Proceso de adaptación española del test..
 Justificación estadística (tratamiento de los datos, fiabilidad, validez, estudios
comparativos, grupos normativos especiales, estudios transculturales).
 Normas de interpretación (parámetros de cómo valorar cada una de las
puntuaciones que se han obtenido).
 Otros (bibliografía).
 Tablas de los normativos (estudios de estandarización).
A. Estimación de las capacidades intelectuales de una persona.
B. Adaptación de un test en otra lengua a la española (cómo se han superado los sesgos
culturales p.e. en los subtest de información)
C. Datos estadísticos de las características de la muestra con la que se ha hecho la
estandarización (p.e. edad, sexo, nivel educativo) en el WAIS p.e. hay datos de varias
edades.
MANUAL DE APLICACIÓN Y CORRECCIÓN (cómo se administran cada una de las
tareas):
 Ámbito de aplicación (lugar)
 Cualificación del examinador (condiciones psicológica en individuales, si tiene
dificultad para comprender o algún problema sensorial).
 Procedimiento normalizado (reglas, instrucciones, etc.)
 Tiempo de aplicación (para cada subtest, tiempo mínimo esperado en el WAIS
hora y media).
 Condiciones ambientales.
 Tablas y baremos de corrección y ajustes estadísticos (inicialmente aparecen
diferenciados para cada subgrupo de edad)
 Obtención de puntuaciones típicas, escalares y CI/índices.
Cuadernillo/hoja de respuestas, pueden estar o no, Materiales de administración para
cada test, Plantilla de corrección: manual o informatizada.

CARRERA PSICOLOGIA
TIPOS DE PRUEBAS
A.- DE INTELIGENCIA
TEST DE AMPLITUD: Miden el conocimiento y/o el rendimiento. Pueden valorar la

memoria, precisión, destreza, atención, sentido de la organización, agilidad manual y
mental.
-MATRICES DE RAVEN:
Orientados a la valoración de la inteligencia concreta, nivel de observación y organización

lógica.
Consiste en descubrir qué figura corresponde al cuadro en blanco de los otros que
aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que mantienen
un orden lógico. Interesan la identificación y la diferenciación de formas.
Son ejercicios en orden de dificultad creciente. El tiempo está limitado, con lo cual hay
que evitar estancarse en un ejercicio.
-FICHAS DE DOMINÓ: Miden la abstracción lógica.
-TEST DE RAZONAMIENTO: Miden las facultades de adaptación: agilidad mental,

resolución de problemas, etc...
-TEST DE COMPRENSIÓN VERBAL: Miden la comprensión de ideas, facultad de

análisis y síntesis.
B.- DE PERSONALIDAD
-TEST DE RORSCHACH: Analiza las dimensiones intelectual, afectiva y de

comportamiento.
-TEST DE APERCEPCIÓN TEMÁTICA: Evalúa los factores y necesidades de la conducta

y de las motivaciones, valorando las emociones y estados internos.
-TEST DE ÁRBOL: Revela a la persona en la vida interior y el desarrollo afectivo.
En definitiva en un prueba psicotécnica nos podemos encontrar los siguientes puntos:
Test de información: Evalúan cuestiones relacionadas con el vocabulario, fluidez verbal y

significado de las palabras.
Problemas aritméticos: Intentan medir la capacidad para resolver problemas aritméticos y
matemáticos mediante ejercicios relacionados con números.
Series numéricas: Estos ejercicios prueban la capacidad para resolver problemas
aritméticos y matemáticos, convirtiéndose en una buena forma de medir el razonamiento
inductivo o razonamiento abstracto. Las series numéricas pueden presentarse de forma
que el individuo complete los números que faltan o bien se les da a elegir el número
siguiente entre varias alternativas posibles.
Series alfabéticas: Del mismo modo que con las series numéricas, se pretende medir
también el razonamiento abstracto.
Problemas de razonamiento no verbal: Son test que se han creado con figuras o
símbolos para medir la inteligencia general o el razonamiento abstracto.
Ejercicios de visualización: Evalúan la capacidad para captar relaciones espaciales. Es
importante para aquellas personas que deben manejar objetos, máquinas, planos, etc.
Test de capacidad mecánica: Tienen como finalidad identificar a aquellos individuos con
aptitudes para trabajos de carácter mecánico y trabajos de mantenimiento.

CARRERA PSICOLOGIA
Test de personalidad: Tratan de buscar rasgos de carácter, acordes con el perfil del
puesto: introvertido o extrovertido, dinámico o pasivo, optimista o pesimista, con iniciativa
o sumiso, impulsivo o moderado, etc.
Test de aptitudes administrativas: Sirven para medir la capacidad de percepción, rapidez
de lectura, de precisión en actividades específicas, cálculo aritmético, comprobación de
datos, ortografía, archivo, comprobación de errores, etc.
Pruebas psicométricas y proyectivas:
CLEAVER
Prueba que describe el perfil laboral de cada candidato. Describe el comportamiento y
habilidades del personal en la organización, apoyando los programas de Planeación de
Recursos Humanos, mejorando la comunicación y el desempeño en el trabajo
AUTODESCRIPCION DEL CANDIDATO

Describe en términos de comportamiento, la percepción que el individuo tiene de sí
mismo, con relación al puesto que desempeña, clarificando las diferencias existentes
entre el puesto y el ocupante del mismo.
RASGOS A MEDIR EN CADA CANDIDATO:
* COMPORTAMIENTO DIARIO
COMPORTAMIENTO BAJO PRESIÓN
INDICADORES DE MOTIVACIÓN
TERMAN MERRIL
Prueba para la medición del Coeficiente Intelectual I.Q., conocimientos generales,
comprensión, análisis y síntesis, razonamiento, aritmética, juicio práctico, sentido común
y capacidad de deducción.
Proporciona una medida de la inteligencia para examinados adultos, esta orientado para
personas de nivel escolar bachillerato o superior.
INVENTARIO MULTIFASICO DE LA PERSONALIDAD MMPI- ESPAÑOL

Prueba de personalidad conocida también como MINESOTA, consta de 566 preguntas y
está enfocada a la selección de personal, sin embargo la gráfica que se obtiene, se
puede usar para un análisis más profundo o clínico.
Describe de manera textual las siguientes características: Hipocondriasis, Depresión,

Histeria, Personalidad psicopática, Masculinidad-Feminidad, Paranoia, Obsesivo-
Compulsivo, Esquizofrenia, Manía, Introversión Social, Capacidad de Autocrítica,
Capacidad de Liderazgo, Actitud de Servicio, Capacidad para trabajar bajo presión,
Capacidad para trabajar en equipo, Sentido de la realidad, Metas y logros, Meticulosidad
y Detallismo.
BARSIT
Determina rápidamente el nivel de inteligencia o aptitud para aprender. - Compara la
composición de grupos, selecciona previamente casos excepcionales. - Adaptabilidad del
sujeto.
HTP: (sigla que proviene de House, Three, person)

El test de la casa/árbol/persona es un test proyectivo basado en la técnica gráfica del
dibujo, a través del cual podemos realizar una evaluación global de la personalidad de la
persona, su estado de ánimo, emocional, etc. La realización de dibujos es una forma de
lenguaje simbólico que ayuda a expresar de manera bastante inconsciente los rasgos
más íntimos de nuestra personalidad.

CARRERA PSICOLOGIA
IPV (Inventario de la Personalidad del Vendedor )

Proporciona la medida de la Disposición General para la Venta (DGV) del candidato en
dos dimensiones amplias las cuales son Receptividad y Agresividad.
KOSTICK:
El Inventario de Preferencias y Percepciones de Kostick es un instrumento diseñado para
ayudar a comprender los estilos administrativos de las personas, que permite evaluar a
los candidatos a un puesto y a descubrir gente de éxito en las organizaciones.
MACHOVER:
Prueba proyectiva mediante la cual se evalúa maduración, organicidad y cuadros
patológicos.
La personalidad se desarrolla a través del movimiento, sentimiento y pensamiento de un
cuerpo específico.
Los métodos proyectivos han puesto repetidamente determinantes profundos y quizás
inconscientes, de expresión propia, los cuales no podrían manifestarse en comunicación
directa.
Toda actividad creadora lleva el sello específico de conflicto y necesidades que presionan
sobre el individuo que está creando. La actividad despertada como respuesta a "Dibuje
una persona", es en verdad una experiencia creadora. El dibujo de la figura humana
indica una unión entre la figura y la personalidad del individuo que la realiza.
ZAVIC
Prueba para evaluar los valores e intereses de los individuos: Consta de 20 preguntas
con cuatro opciones cada una, se divide en dos áreas : Valores : Moral, Legalidad,
Indiferencia y Corrupción Intereses : Economico, Politico, Social y Religioso.
Otras....
1.Actividades Instrumentales De La Vida Diaria

2.Audit(alcohol Use Disorders Identification)
3. Barber - Encuesta Deteccion De Ancianos Con Riesgo
4. Barnes Para Evaluacion De Acatisia
5. Bender Koppitz Escala De Maduracion Neuro Motriz
6. Bprs - Escala Breve De Evaluacion Psiquiatrica
7. Cage
8. Clasificacion Rorschach
9. Componentes Obsesivo - Compulsivos De La Bebida
10 Coopersmith
11 Criterios De Ingreso Por Riesgo De Suicidio
12 Cuestionario Apgar Familiar
13 Cuestionario Apoyo Social Funcional
14 Cuestionario De 90 Sintomas - Scl - 90 - R -
15 Cuestionario De Actitudes Ante La Alimentación , Eat - 40 -
16 Cuestionario De Actitudes Ante La Allimentación , Eat - 26 -
17 Cuestionario De Actividad Funcional De Pfeffer
18 Cuestionario De Afrontamiento Del Dolor
19 Cuestionario De Apoyo Social De Sarans
20 Cuestionario De Cambios Vitales Recientes
21 Cuestionario De Dolor De Mcgill
22 Cuestionario De Estado Mental Portatil
23 Cuestionario De Estres Percibido De Leve
24 Cuestionario De Experiencia Traumatica
25 Cuestionario De Miedos
26 Cuestionario De Salud General De Gold

CARRERA PSICOLOGIA
Actividad 12 AL 15
ESTADISTICAS QUE SE UTILIZAN PARA LAS MEDICIONES

PSICOLOGICAS
TRATAMIENTO ESTADISTICO
DISTRIBUCION DE FRECUENCIAS LA DISPERSION

LA MEDIANA ( Me )
Dada una distribución de frecuencias con los valores ordenados de menor a mayor,
llamamos mediana y la representamos por Me, al valor de la variable, que deja a su
izquierda el mismo número de frecuencias que a su derecha.
LA MEDIA ARITMÉTICA ( X )
La media aritmética o simplemente media, que denotaremos por X , es el número
obtenido al dividir la suma de todos los valores de la variable entre el número total de
observaciones.
LA DESVIACIÓN ESTÁNDAR:
En rigor, esta medida de dispersión es utilizada con más frecuencia por los estadísticos.
Supongamos las observaciones x1, .., xi, .., xn, entonces la desviación estándar S se
define como
Observemos como antes que esta desviación estándar tiene la misma unidad que las
observaciones. En rigor es un promedio de las diferencias cuadráticas de las
observaciones respecto de la media. El cuadrado permite eliminar los signos negativos,
de modo que no se anulen diferencias simétricas en torno de la media.
PERCENTILES (PI)
Son los valores que dividen a la distribución en 100 partes iguales, cada una de las
cuales engloba el 1 % de las observaciones. En total habrá 99 Percentiles. (Q2 = D5 =
Me = P50)
COEFICIENTE DE CORRELACIÓN
Un coeficiente de correlación se dice que es significativo si se puede afirmar, con una
cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos,
preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa
que preguntarse por la probabilidad de que tal coeficiente proceda de una población
cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hipótesis
posibles.
TRANSFORMACION DE PUNTAJES DIRECTOS A PUNTUACIONES ESTANDAR
Esta técnica es la más conocida y utilizada en el marco de la TCT, al punto que muchos
usuarios asumen que es la única existente para estimar la Puntuación Verdadera. Se trata de
un procedimiento ampliamente recomendado por muchos autores (e.g. Allen & Yen, 1979;
Anastasi & Urbina, 1998; Felt & Brennan, 1989; Gulliksen, 1950) que consiste en utilizar el
EEM para construir un intervalo de confianza en torno a la Puntuación Observada.
Teóricamente, el procedimiento se fundamenta en asumir que los errores de medida se
distribuyen normalmente. Bajo este supuesto es posible utilizar el EEM para construir un
intervalo de confianza para la Puntuación Verdadera, en torno a la Puntuación Observada.
Sin profundizar en la derivación de la fórmula (para tal efecto ver, por ejemplo, Muñiz, 2001),
las ecuaciones para el límite inferior y superior del intervalo de confianza corresponden a:

CARRERA PSICOLOGIA
En ambas ecuaciones, x es la Puntuación Observada de un sujeto y Z representa el valor de

la distribución normal asociado a la magnitud del intervalo de confianza que se desea
construir. La práctica convencional es construir un intervalo no direccional de un 95% de
confianza, al que corresponde un valor Z = 1.96. Para ilustrar la aplicación del método,
supongamos que una persona obtiene 55 puntos en el test de autoestima, cuyo error
estándar de medida calculamos en el apartado anterior (EEM = 4.47). ¿Cuál será su
Puntuación Verdadera en el test? Aplicando las ecuaciones (6a) y (6b) para determinar los
límites inferior y superior del intervalo de confianza al 95% (Z = 1.96), concluimos que Z
(EEM) = 8.76 y, por tanto, que la Puntuación Verdadera se encontrará entre 46.2 y 63.8
puntos en el test. Puede observarse que, aun cuando las puntuaciones arrojadas por el test
parecen fiables, el intervalo de confianza que contiene a la Puntuación Verdadera, con un
95% de confianza, es bastante amplio (17.6 puntos de magnitud).
La interpretación del intervalo de confianza construido con la metodología tradicional no es
fácil. Allen & Yen (1979) lo explican de la siguiente manera. Si una persona, que obtuvo un
Puntaje Observado X en el test, fuera evaluada infinitas veces con la misma medida y
construyéramos un intervalo de confianza de un 95% después de cada ocasión, en el 95%
de las veces el intervalo incluiría la Puntuación Verdadera de la persona. Cuando existe sólo
un intervalo, hay un 95% de confianza de que éste incluya la Puntuación Verdadera. En
forma alternativa, se puede imaginar que un gran número de personas fueron evaluadas y
se obtuvo un intervalo de confianza para cada una, centrado en la Puntación Observada para
cada examinado. El 95% de esos intervalos debería incluir la Puntuación Verdadera del
sujeto.
Cociente Intelectual (CI). Indicador del nivel de inteligencia utilizado en las primeras
pruebas psicométricas y que se calculaba mediante la división de Edad Mental (calculada
por el test) y Edad Cronológica (edad real del Sujeto) multiplicada por 100. Un valor de
100 (igual edad mental y edad cronológica) indica normalidad, mientras que por debajo
indica “retardo” y por encima “aceleración”.
Cociente Intelectual de Desviación (CI Desviación). Sustituto del Cociente Intelectual
original se desarrolló por las diferencias existentes en la varianza de las puntuaciones del
Cociente Intelectual en los diferentes niveles de edad, que dificultaban la interpretación
de los resultados. Es en realidad una transformación que tiene una media de 100 y una
desviación típica de 15.
Coeficiente de Correlación. Medida del grado de asociación que existe entre dos
conjuntos de medidas realizadas en el mismo grupo de individuos. El más conocido y
utilizado con Pruebas Psicométricas es Producto Momento de Pearson, aunque existen
otros como correlación por rangos, biserial, tetracórico, etc. Tiene un recorrido entre
+1.00 y –1.00 (asociación perfecta positiva o negativa), pasando por 0.00 (ausencia de
relación entre ambas medidas). La correlación indica solamente asociación entre
variables, no relaciones causales.
Competencias. Características de las personas directamente relacionadas con el
desempeño exitoso de un trabajo o una actividad. Incluyen conocimientos,
habilidades, disposiciones afectivas, rasgos físicos y conductas de carácter
relativamente estables que se pueden aplicar a diferentes situaciones y tipos
de trabajo o tareas.
Confiabilidad. El grado en que un test es consistente al medir la variable que mide.
Algunas palabras asociadas con la Confiabilidad son estabilidad, exactitud, consistencia y
precisión, así como el Error Estándar de Medida. La Confiabilidad se expresa usualmente
mediante coeficientes de correlación, obtenidos a partir de los puntajes en dos
aplicaciones de la misma prueba al mismo grupo de Sujetos o haciendo uso de pruebas
paralelas aplicadas al mismo grupo de sujetos. También se define como Consistencia
Interna, que se obtiene mediante la determinación de las intercorrelaciones o
Covarianzas de los ítems.
Construcción de pruebas, fases de la. Las pruebas psicométricas se construyen
mediante un cuidadoso proceso, que garantiza la calidad de las mismas. Tavella identifica
varias fases: 1) Preparatoria, en la que se define (teórica y operacionalmente) la variable
a explorar, se establecen las especificaciones del instrumento, se elaboran los ítems, se
depuran cualitativamente mediante el juicio de expertos, se elaboran instrucciones y se

CARRERA PSICOLOGIA
estructura el instrumento. 2) Exploratoria, en la cual se aplica a una muestra informal de

sujetos de la misma población a la cual va dirigida, se realiza análisis de ítems para
determinar su calidad y se depura el instrumento. 3) Experimental, en la cual se aplica el
instrumento ya depurado en la fase anterior a muestras formales de sujetos, hasta
conocer mejor el instrumento, elaborar estudios de validez y confiabilidad y normas. 4)
Definitiva, en la cual ya se considera que el instrumento está listo para su uso en grupos
extensos de la población, así como para la realización de estudios normativos a gran
escala.
Constructo. Las variables psicológicas no son observables directamente, por lo que se
infieren a través de la observación de la conducta de las personas, y se plantean en
términos teóricos. Son inventados y adoptados en forma deliberada y consciente por la
comunidad científica, es decir, “construidos” por los investigadores y teóricos de la
psicología.
Corrección (puntuación) de Pruebas. Es la asignación de puntajes a las respuestas
dadas por un sujeto a las preguntas de una prueba. La mayoría de las veces se realiza
mediante la asignación de un punto por cada respuesta correcta (ítems binarios), es
decir, que coincida con la clave de respuestas (ver Clave de Corrección), aunque también
son posibles otras formas de corrección, como restar a las respuestas correctas una
proporción de las incorrectas. Consulte también Puntaje Directo o Puntaje Bruto.
Corrección de Puntajes por Azar. Los ítems de opciones múltiples permiten responder
al azar y alcanzar un cierto número de aciertos, es decir, permiten la adivinación de las
respuestas. Por ejemplo, en una prueba de 40 ítems de cuatro opciones, la probabilidad
de marcar la respuesta correcta por azar es de 25%, lo que permite establecer una media
de puntajes por azar de 10 puntos y una desviación típica de 2,73 (en una distribución
binomial, la media es 0,25x40= 8 puntos y la desviación típica raíz de 0,25X0,75x40=
2,73). Por ello se han propuesto formas de corrección por puntajes por azar. La más
común es la siguiente, en donde Xc es puntaje corregido, C es el número de respuestas
correctas, I es el número de incorrectas y k es el número de opciones. Estas fórmulas
asumen que toda respuesta incorrecta es una respuesta al azar; lo usual es que se le
recomiende al Sujeto, que se abstenga de dar respuestas en las que no esté
completamente seguro y se le advierta sobre el uso de la fórmula de corrección.
Correlación Múltiple. La correlación que se establece entre una variable predicha y
varias variables predictoras en contraste con la Correlación simple. Por ejemplo, el
rendimiento universitario (Criterio) que se predice haciendo uso de los resultados en
varios tests (variables predictoras). La Correlación Múltiple tiene especial aplicación en
las Ecuaciones de Regresión Múltiple, que permiten establecer una recta de regresión
que incluye varias variables predictoras de la forma siguiente (en donde K es una
constante, βnXn es la ponderación que se le da a cada una de las variables predictoras):
Correlación simple. Relación que se establece entre una variable predictora (o
independiente) y una variable predicha (o Criterio). Es el modelo más sencillo de
correlación. Véase Correlación Producto Momento de Pearson.
Correlación producto momento de Pearson. Coeficiente de correlación que permite
establecer el grado de asociación entre dos variables continuas. Dado que se
fundamenta en los mínimos cuadrados, exige que las variables guarden una relación
lineal entre ambas y que presenten homocedasticidad.
Criterio de Validación. Es un estándar mediante el cual se evalúa la validez de un test.
Se requiere que sean también una medida de algún tipo, es decir, que se expresen en
una Escala Cuantitativa. Pueden ser el rendimiento en otra variable como otro test, la
apreciación de un supervisor en el trabajo, los juicios de un profesor, notas en un curso,
etc. Usualmente se establece una correlación entre el rendimiento en el test y la
puntuación en el criterio para decidir cuál es el grado de asociación entre el test y el
criterio, lo que permite predecir el rendimiento a futuro o determinar el nivel actual en el
criterio.
Desviación Típica. Es una medida de la variabilidad o dispersión de una distribución de
puntajes. Mientras menos dispersos están las puntuaciones alrededor de la Media menor
es la desviación típica, mientras más se dispersan, mayor es la Desviación Típica.
Cuando se trata de una Distribución Normal, existen algunas relaciones importantes. Por

CARRERA PSICOLOGIA
ejemplo, a una desviación típica por encima y por debajo de la Media se encuentra el
68,26% de la distribución. El cálculo de la Desviación Típica se realiza mediante el
cálculo de la raíz cuadrada de la sumatoria de los desvíos de los puntajes con respecto a
la media elevados al cuadrado. Es también la raíz cuadrada de la Varianza.
Dificultad de los ítems. El grado de dificultad de un ítem se determina mediante la
proporción de respuestas correctas (cociente entre respuestas correctas divididas entre el
número de respuestas totales). La proporción que se obtiene se denomina a la media del
ítem, o “la p del ítem” y es un indicador directo de su facilidad, o inverso de la dificultad,
ya que su valor, comprendido entre 0 y 1, indica que mientras más se acerca a 0 es más
difícil el ítem (puesto que fue respondido por un menor número de personas) y mientras
más se acerca a 1 es más fácil (respondido por un mayor número de personas).
Error Estándar de Medida Sem. Es un estadístico que estima la posible magnitud del
error presente en un puntaje individual. El Error Estándar de Medida indica la diferencia
que puede existir entre el Puntaje Obtenido y el Puntaje Real o Verdadero (T), que se
supone que refleja la verdadera posición del individuo en un continuo subyacente; esa
diferencia se debe a errores de medida. Mientras mayor es el Error Estándar de Medida,
menos confiable es la puntuación obtenida. El Error Estándar de Medida es una magnitud
tal, que en aproximadamente dos terceras partes de los casos, el puntaje obtenido no
diferirá más de un Error Estándar por encima o por debajo del Puntaje Real. En teoría se
puede decir, que en 2 de cada 3 casos, el puntaje obtenido se encuentra en una banda
que se extiende del Puntaje Real más o menos un Error Estándar de Medida; pero debido
a que el Puntaje Real nunca se puede conocer, la práctica establece que, para la
interpretación, se puede revertir la relación Puntaje Verdadero – Puntaje Obtenido.
Escala. La sucesión de números en función de los cuales se realiza la medición.
Clásicamente se distinguen cuatro niveles: Nominal, Ordinal, Intervalo, Razón. También
se entiende por escalas, las transformaciones de puntajes que se realizan a escalas de
propiedades conocidas, tales como Estaninas Percentiles, puntaje Z, Puntaje H, etc.
Estadística Descriptiva e Inferencial. La E. Descriptiva es una rama de la estadística
aplicada que permite describir las características de las distribuciones en función de los
datos obtenidos. La E. Inferencial es una rama de la estadística que permite realizar
inferencias sobre el comportamiento de los estadísticos en la población o un segmento de
ella. Ambas son absolutamente necesarias en el trabajo estadístico de los datos
psicométricos.
Frecuencia. Es el número de observaciones que corresponde a un determinado puntaje
en una escala. Usualmente las observaciones son los sujetos que obtuvieron ese puntaje.
Frecuencia Acumulada. Es el número de observaciones acumuladas hasta el límite
superior de un determinado puntaje en una escala. Se acumula siempre desde las
puntuaciones más bajas en la Escala hacia los más altos.
Inventario de Personalidad. Es un tipo de Prueba Psicométrica que consiste en un
cuestionario o lista de chequeo, usualmente autoadministrada, diseñada para obtener
información de variables no intelectuales de un individuo. Los inventarios usualmente
evalúan rasgos tales como intereses, actitudes, motivación, etc. (véase Pruebas de
Personalidad).
Ítems. Son los estímulos o reactivos que se presentan a los sujetos para que respondan
y pongan de manifiesto conductas asociadas con un atributo determinado. Dependiendo
del tipo de prueba, los ítems varían sustancialmente. Un tipo común de ítem son los de
opciones múltiples, que presentan un problema en el “pie” y varias opciones de respuesta
de las cuales sólo una es la correcta (la clave) y las otras son Distractores, que sirven
para atraer la respuesta de quienes no conocen realmente la respuesta correcta.
Media o Media Aritmética. Es el promedio de las puntuaciones obtenidas por un grupo
en un test. Se obtiene mediante la suma de las puntuaciones y la división
entre el número de ellas.
Medición. Consiste en la asignación de numerales a las propiedades de los objetos o
eventos de acuerdo a ciertas reglas (Stevens). En medición psicológica, los objetos son
las manifestaciones de los atributos psicológicos o constructos. Se fundamenta en varios
supuestos: a) la asunción de la existencia de un continuo subyacente con direccionalidad,
b) la existencia de un solo puntaje verdadero para cada sujeto, c) la variabilidad entre

CARRERA PSICOLOGIA
sujetos con relación al puntaje verdadero y d) la posibilidad de obtener manifestaciones

asociadas con la posición que la persona ocupa en el continuo subyacente. De esta
manera, se asignan puntuaciones, de acuerdo a ciertas reglas, a las manifestaciones de
conducta asociadas al atributo psicológico que se desea medir. Las puntuaciones se
interpretan en función de la teoría psicométrica y psicológica, para inferir acerca de la
conducta actual, de la futura o de las potencialidades de la persona. La medición
usualmente implica la existencia de un propósito y una decisión que debe tomarse con
relación a los Sujetos de la medición o de los atributos medidos.
Mediana. Es la puntuación en una distribución de puntajes por encima de la cual se
encuentra el cincuenta por ciento de las observaciones.
Medidas de Dispersión. Estadísticos que permiten establecer la variabilidad de un
conjunto de datos. Por ejemplo: la Varianza, y la Desviación Típica.
Medidas de Tendencia Central. Estadísticos que permiten conocer la ubicación de la
distribución en un continuo, por ejemplo: Media, Mediana y Moda,
Moda. Es la puntuación que tiene la frecuencia más alta en una distribución. Algunas
distribuciones pueden ser bimodales o multimodales.
Muestra. Una parte de una Población o universo; un subconjunto de observaciones de
una población. Si la población está compuesta de individuos, la Muestra constituye un
grupo de individuos provenientes de esa población. Se desea que las Muestras sean
representativas de la población para poder inferir los parámetros de la población a partir
de los estadísticos de la Muestra. La representatividad se logra asegurando que todos los
individuos de la población tienen la misma probabilidad de ser seleccionados para la
Muestra, se habla así de muestreo probabilístico. Esto se logra mediante esquemas de
muestreos entre los que se incluyen como sus elementos básicos: Muestreo por Azar
Simple, Muestreo por Azar Sistemático, Muestreo Estratificado, Muestreo por
Conglomerado. Estos esquemas exigen
BIBLIOGRAFÍA
Arnau, J. (1989). Metodología de la investigación y diseño. En J. Arnau y H. Carpintero

(Eds.). Historia, teoria y método. Madrid: Alhambra Universidad.
Canpintero, H. (1996). Historia de las ideas psicológicas. Madnd: Pirámide.
Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos y educativos.
Madrid: Síntesis.
Meliá, J.L. (1990). La construcción de la Psicometría coma ciencia teórica y aplicada.
Valencia: Cristóbal Serrano.
Muñiz, J. (1991). Introducción a los métodos psicofísicos. Barcelona: PPU.
Muñiz, J. (1998). La teoría clásica de los tests. Madrid: Pirámide.
Nunnally, J. C. (1973). Introducción a la medición psicológica. Buenos Aires: Paidós.
REFERENCIAS DE LA WEB:
 http://www.gestiopolis.com/canales8/rrhh/psicometria-como-ciencia-del-
compotamiento-y-los-recursos-humanos.htm
 http://www.uam.es/docencia/ace/
 http://www.uaim.edu.mx/web-
carreras/carreras/Etnopsicologia/07%20TRIMESTRE/PSICOMETRIA.pdf
 http://html.rincondelvago.com/psicometria_5.html
 http://es.wikipedia.org/wiki/Teoría_de_respuesta_al_ítem
 http://es.wikipedia.org/wiki/Test_psicológico

Modulo de Psicometria

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Modulo de Psicometria

Caricato da

Copyright:

Formati disponibili

UNIVERSIDAD TECNOLOGICA BOLIVIANA

Docente : Lic. María Patricia

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 1

1. Explica y describe los aspectos fundamentales de la psicometría.

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 2

FUNDAMENTOS DE LA TEORÍA Y LA PRÁCTICA DE LA PSICOMETRÍA

Antecedentes históricos de la psicometría:

Las raíces de la aplicación de pruebas, se encuentran en la antigüedad partiendo de los

Concepto de psicometría: La Psicometría es la ciencia cuyo objeto es medir los

Importancia de la medición en psicología: La importancia de la medición psicológica

Medición y estadística: En 1816 Bessel Astrónomo de Greenwich, con base en sus

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 3

Principios éticos y deontológico en la medición psicológica: “La deontología refiere a

Las escalas de medición en psicología: Medir es utilizar los procedimientos

Métodos de elaboración de escalas: Cohen (2001) define “elaboración de escalas

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 4

En la medición escalar de sujetos, los estímulos se constituyen en reactivos los cuales se

Escalas multidimensionales: Las técnicas de elaboración de escalas

Teoría de la Generalizabilidad. Fue desarrollada por Cronbach y sus colegas, esta

La escuela americana (Thurstone): Thurstone no concordaba con la existencia de un

La estructura del intelecto de Guilford: El realizó un estudio muy completo de las

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 5

Teoría de la respuesta al ítem: Este es un modelo probabilística y permite conocer la

Teorías cognitivas y psicometría: La información almacenada en la memoria, consta de

Teoría triarquica de Stenberg: En esta teoría Stenberg combina la cognición y el

 La componencial, (inteligencia académica).

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 6

MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR

Una vez seleccionado el tipo y el diseño de investigación apropiado y la muestra

1.Seleccionar un instrumento de medición de los disponibles en el estudio del

2.Aplicar ese instrumento de medición, es decir, obtener las observaciones y mediciones

3.Codificar, analizar e interpretar estas mediciones.

¿QUÉ SIGNIFICA MEDIR?

De acuerdo a definiciones clásicas como la de Stevens (1951), significa “asignar números

¿QUÉ REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION?

Toda medición o instrumento de recolección de datos debe reunir dos requisitos

LA CONFIABILIDAD de un instrumento de medición se refiere al grado de precisión o

LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 7

sentimientos, emociones, etc, la validez de un instrumento que pretenda medirlas se

LA VALIDEZ ES UN CONCEPTO DEL CUAL PUEDEN TENERSE DIFERENTES TIPOS

Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al grado

Evidencia relacionada con el criterio. LA VALIDEZ DE CRITERIO implica que la medición

Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es

VALIDEZ TOTAL = Validez de contenido + validez de criterio + validez de constructo

FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ

a)La improvisación. Algunas personas creen que elegir un instrumento de medición o

b)El no estar validados en el contexto donde se aplican. Traducir un instrumento, aún

c)El instrumento e inadecuado o no es empático. Hay instrumentos que tienen un

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 8

corto, el hambre o falta de motivación para responder influirá negativamente en la validez

¿CÓMO SE SABE SI UN INSTRUMENTO ES CONFIABLE Y VALIDO?

Para la confiabilidad, generalmente todos los procedimientos utilizan fórmulas que

Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es aplicado

Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el

Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos

Lic. Maríía Patricia Canaviri Cusicanqui Paí gina 9

PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION

2.Revisar su definición conceptual y comprender su significado. Por ejemplo, comprender

3. Revisar cómo han sido definidas operacionalmente las variables. La

4.En caso de no encontrar un instrumento desarrollado adecuado, válido y confiable y se

Por parte de los Docentes

Por parte de los Padres