Psi Come Tra

PSICOMETRA
Diseado por:
Germn Andrs Torres
Escobar
Hitos en la historia de la
psicometra
AO
HITO O ACONTECIMIENTO
1115 a.C.
En China se utilizan tests para acceder a puestos en el gobierno.
1869 d C.
Francis Galton publica el libro Genio Hereditario (1869) donde plantea a travs
de estudios estadsticos que la inteligencia se hereda.
1904 1910 d. C.
Charles Spearman funda la Teora Clsica de los tests o del modelo lineal
y publica su teora de los factores de la inteligencia y las formulas de atenuacin.
1905 d.C.
Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios,
con el fin de establecer su edad mental y predecir su rendimiento acadmico.
1918 d.C.
Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados
durante la Primera Guerra Mundial y Robert Woodworth elabor el primer Personal
Data Sheet para detectar los soldados que pudieran tener crisis nerviosas.
1931 d.C.
Thurstone publica su libro The reliability and validity of tests.
1939 d.C.
Wechsler propone su escala de medida para la inteligencia.
1940 d.C.
Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Inventory (MMPI).
1960 d.C.
Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de

varianza para interpretar las fuentes de error en los puntajes.
1980 d.C.
Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite
conocer la informacin de cada tem para disear pruebas individualizadas.
La psicometra
Es la rama de la
psicologa
que
desarrolla y estudia
las propiedades de
las
pruebas
psicolgicas o tests
para
medir
las
variables
psicolgicas con la
mayor
precisin
posible.
Diferencia entre psicometra y

evaluacin psicolgica
Psicometra
nfasis en la
medicin
Instrumentos y tests
Evaluacin
psicolgica
nfasis en el
diagnstico
La persona
Historia de la psicometra
Antecedentes
Modelos
histricos.
de medicin.
Antecedentes histricos
Hacia el ao 1115 a.C. se utilizan comienzan a

utilizar en China los primeros tests que buscan
medir las capacidades de aspirantes para acceder
a puestos del gobierno (primera medicin de
capacidades).
En 1869 Francis Galton publica el libro Genio

Hereditario donde plantea a travs de estudios
estadsticos que la inteligencia se hereda y que
es posible medirla (estudios estadsticos en
psicologa).
Entre 1904 y 1910 Charles Spearman

funda la Teora Clsica de los tests o del
modelo lineal y publica su teora de los
factores de la inteligencia y las formulas
de atenuacin (Estrategias de medicin
y TCT).
En 1905 Alfredo Binet y Theodore Simon

publican la primera escala de inteligencia
para nios, con el fin de establecer su
edad mental y predecir su rendimiento
acadmico (uno de los primeros tests
psicolgicos).
En 1960 Lee Cronbach propone su Teora

de la Generalizacin en la cual utiliza el
anlisis de varianza para interpretar las
fuentes de error en los puntajes.
Igualmente l desarroll estrategias para
la medicin de la confiabilidad de un test.
En 1980 Rasch plantea la Teora de la

Respuesta al tem o del rasgo latente que
permite conocer la informacin de cada
tem
para
disear
pruebas
individualizadas.
Modelos de medicin
Teora Clsica de
los Tests (TCT)
Anlisis de la prueba
completa
En una muestra
pequea de sujetos (N
< 500)
Teora de la Respuesta
al tem (TRI)
Anlisis de tems
individuales
En grandes muestras
de sujetos (N 500)
Teora clsica de los Tests
El modelo de puntuacin verdadera se

concreta en un primer supuesto:
X=V+E
que indica que la puntuacin emprica
directa de una persona en un test (X) est
compuesta por la puntuacin verdadera de la
persona (V) y un error de medida (E) que se
comete al medir el rasgo con el test.
El error de medida se establece como la

diferencia entre la puntuacin emprica y la
verdadera:
E=X-V
La puntuacin verdadera se obtiene con el

promedio de las puntuaciones empricas que
obtiene la persona en un nmero elevado de
aplicaciones del test:
V = E[X]
Si en una poblacin se conocen las

puntuaciones V y E de los individuos, la
correlacin entre ambas variables sera nula,
porque
se
asume
que
puntuaciones
verdaderas elevadas no tienen porqu tener
asociados errores elevados:
r VE = 0
Si en una poblacin conociramos los

errores de medida de cada individuo quien
ha realizado dos tests diferentes (j y k), la
correlacin entre ambas variables tambin
sera nula:
E jEk = 0
Si en una poblacin conociramos las

puntuaciones E en un test j y las
puntuaciones V en un test k, ambas
variables correlacionaran cero:
E jVk = 0
Limitaciones de la Teora
Clsica
Las caractersticas de los tems (dificultad y

discriminacin) dependen del grupo de personas
en el que se han aplicado.
La puntuacin que una persona obtenga ser

diferente si se le aplican dos tests que midan la
misma caracterstica pero cuyo nivel de dificultad
sea diferente.
La TCT supone que el error de medida es una

propiedad del test y, por lo tanto, igual para todos
los sujetos, independientemente de cual sea su
puntuacin.
Teora de la Respuesta al
tem
Unidimensionalidad: todos los tems que forman el

test han de medir un mismo y nico rasgo. El
supuesto de unidimensionalidad exige que todos y
cada uno de los tems del test midan una nica
dimensin.
No hay como tal puntuaciones verdaderas sino una

probabilidad de acierto determinada por unos
parmetros.
Independencia local: entre los tems de un test si la

respuesta que una persona da a uno de ellos no
depende de las respuestas que da a los otros, ni por el
orden de presentacin de los tems, las respuestas
que ya se hayan dado, etc.
Un prueba psicolgica o test
Es un instrumento en formato impreso o

digital que consta de una serie de
preguntas o reactivos que miden unas
variables psicolgicas especificas a travs
de un sistema de puntuacin.
Puede aplicarse en diferentes campos de

la psicologa, para fines diversos como
diagnstico clnico (psicologa clnica) ,
seleccin
de
personal
(psicologa
organizacional) o anlisis de aptitudes
vocacionales (psicologa educativa).
Estructura general de un test

impreso
Cuadernillo de instrucciones.
Cuadernillo de preguntas.
Hoja(s) de respuestas.
Plantilla de correccin.
Tabla de puntuaciones y baremos.
El cuadernillo de
instrucciones
Es
un
documento
donde
se
menciona:
El nombre de la prueba, sus autores
y el ao de publicacin.
La(s) variable(s) que mide y sus
objetivos.
Los antecedentes (marco conceptual
y terico) de la prueba.
Las instrucciones generales de
El cuadernillo de preguntas
Es un documento que consta de:

Las instrucciones de respuesta (para quien
la va a responder).
Los tems o preguntas.
No puede rayarse ni se puede escribir
sobre este ya que se usa en diferentes
aplicaciones.
La hoja de respuestas y plantilla de

correccin
Es la hoja donde la persona anota las

respuestas a de los tems planteados en el
cuadernillo de preguntas.
Una vez que la persona entrega la hoja de

respuestas al psiclogo, l o ella la
califican poniendo encima de la hoja de
respuestas, la plantilla de correccin para
ver en cuales acert el sujeto y en cuales
no.
El sistema de puntuacin
Puntuacin cruda o
bruta
La tabla de puntuaciones y
baremos
Una vez que se han obtenido los aciertos y

errores de la persona con ayuda de la
plantilla, se obtiene una puntuacin
cruda o bruta, que es especifica para ese
sujeto.
Esa puntuacin bruta se analiza en la tabla

de puntuaciones estndar, para obtener
una puntuacin estndar o tpica del
sujeto dentro de la poblacin o muestra de
sujetos que present la prueba (baremo).
Los baremos
Son tablas de puntuaciones estndar que

se clasifican por grupos poblacionales o
muestrales segn la edad, profesin o
gnero.
Por ejemplo, para una misma prueba

existen baremos para hombres, mujeres,
hombres
profesionales,
mujeres
profesionales, estudiantes de secundaria,
etc.
Tipos de pruebas o tests
Clasificacin de las
pruebas
Clasificacin de las pruebas por

aplicacin
Pruebas de autoaplicacin: son tests que no

requieren la aplicacin por parte de un psiclogo
sino que puede hacerlas la persona con ayuda de
un computador.
Pruebas de aplicacin individual: son aquellas

que el psiclogo administra a una sola persona.
Por ejemplo, en un caso clnico.
Pruebas de aplicacin grupal: son aquellas que el

psiclogo pueden aplicar a varias personas al
mismo tiempo, pero controlando que no
conversen entre ellas. Por ejemplo, una prueba
de aptitudes e intereses vocacionales.
Clasificacin de las pruebas segn la

forma de medir la(s) variable(s)
Pruebas de desempeo: miden el rendimiento

mximo (individual) o el rendimiento normal o
tpico (de un grupo).
Pruebas de poder: miden el nivel de destreza

mental de un sujeto o su nivel de conocimiento.
Pruebas de velocidad: miden cuantos tems

responde el sujeto en un tiempo especifico.
Pruebas con referencia a la norma o al criterio:

mide la variables psicolgica segn objetivos
especficos.
Clasificacin de las pruebas segn las

variables que miden
Pruebas
de
(inteligencia).
capacidad
mental
Pruebas
de
conocimiento.
Pruebas de personalidad.
Pruebas de actitudes, aptitudes, intereses,

motivacin, opinin y valores.
Pruebas neuropsicolgicas.
aprovechamiento
Estructura general de un
tem
Enunciado: menciona las instrucciones para

contestar el tem y plantea un contexto o
situacin a partir del cual se hace la pregunta.
Pregunta(s): son cuestionamientos que evalan

directamente la variable psicolgica de forma
implcita. Pueden ser abiertas (libre respuesta) o
cerradas (opciones especificas).
Opciones
de
respuesta:
incluyen
una(s)
respuestas(s) correcta(s) y un(os) distractor(es) o
respuesta(s) falsa(s).
Clasificacin del formato de

respuestas
Clasificacin de los
tems
Clasificacin de las respuestas en

tests de rendimiento ptimo
Eleccin binaria: de dos alternativas, se

elige la que se considera correcta (S o No)
o (verdadero-falso).
Eleccin mltiple: entre ms de dos

alternativas se elige la que se considera
correcta.
Emparejamiento: consiste en encontrar las

parejas entre dos conjuntos de conceptos.
Clasificacin de las respuestas en

tests de rendimiento tpico
Opcin binaria: la persona debe manifestar si

est de acuerdo o en desacuerdo con una
afirmacin.
Categoras ordenadas: el formato establece un

continuo ordinal de ms de dos categoras, que
permite a la persona matizar mejor su respuesta.
Adjetivos bipolares: este formato es tpico de lo

que se denomina "diferencial semntico".
Confiabilidad
Es el grado en el cual las mediciones

repetidas
de
un
fenmeno
relativamente
estable
son
aproximadas entre s o consistentes.
Permite predecir el desempeo de un

grupo o de un sujeto e igualmente
sirve para describirlo en ambos
casos.
Formas de medir la
confiabilidad
Test-retest: consiste en aplicar un test dos veces

a un mismo grupo en un intervalo de das o
meses (no superior).
Formas paralelas: consiste en aplicar un test

homologo o equivalente a un mismo grupo pero
en tiempos diferentes.
Divisin por mitades: consiste en comparar los

resultados de los tems pares e impares en la
aplicacin grupal de un test.
Coeficientes de
confiabilidad
Test-retest: coeficiente de estabilidad

(r).
Formas paralelas:
equivalencia (r).
Divisin por mitades: coeficiente de

consistencia interna (r).
coeficiente
de
Coeficientes ms usados en
divisin por mitades
Formas de mejorar la
confiabilidad de un test
Para calcular el nmero de tems K para

lograr una confiabilidad RXY deseada
(superior a 0.7) se usa la formula:
K = RXY * (1 rXY) / rXY) * (1 RXY)
donde rX es la confiabilidad inicial.
Una vez obtenido el nmero K se
multiplica por el nmero de items inicial y
luego se le resta a ese resultado el nmero
de tems inicial.
Para calcular la confiabilidad al quitar

un nmero de tems X con un total
de tems Y y con una confiabilidad
conocida C se usa la siguiente
formula:
YX/Y
El resultado obtenido con esta
formula debe operarse con la formula
2:
[resultado 1 * C]
[1 + (resultado 1 1) * C]
VALIDEZ
Es el grado en el cual una prueba

mide lo que pretende medir.
Conjunto de pruebas y datos que han

de recogerse para garantizar la
pertinencia predictiva de las
inferencias que hacen a partir de un
test.
Tipos de validez
Validez del contenido.
Validez con relacin a criterio.
Validez del constructo.
VALIDEZ DEL CONTENIDO
Es la muestra adecuada y representativa

de los contenidos que se pretende evaluar
con un test.
Los tems o preguntas se seleccionan

segn su:
Coherencia: con las caractersticas y
variables.
Relevancia: de acuerdo con el indicador.
Buena redaccin: la gramtica del tem.
VALIDEZ CON RELACIN AL

CRITERIO
Es la comparacin del desempeo de

un grupo de sujetos en un test
respecto patrones de medida ya
establecidos.
Se clasifica en:
Validez concurrente.
Validez predictiva.
Validez concurrente
Es el anlisis de variabilidad que

efecta al comparar el desempeo
de dos grupos de distintos de sujetos
en un mismo test.
Tambin se le denomina validez

cruzada o entre distintas muestras.
Validez predictiva
Es el grado de precisin con que las

calificaciones de la prueba predicen
las calificaciones del criterio.
Se obtiene mediante la correlacin

entre una variable de indicador y una
variable criterio a partir de r
(Pearson), cuyo valor es igual o
menor a 0,60.
Factores que afectan la validez

con relacin a los criterios
Las diferencias de grupo:

sexo, edad y rasgos de personalidad.
La contaminacin de los criterios:
evidencias falsas que les restan validez.
El ndice de base (debe ser mayor de 50):

nmero de personas que poseen la variable
medida.
El incremento de la validez:
costo razonable del instrumento.
VALIDEZ DEL CONSTRUCTO
Es el grado de exactitud con el que

se mide un constructo o concepto
psicolgico particular.
Depende de unas condiciones que

son externas al evaluador y la
persona que disea la prueba.
Condiciones de la
validez del constructo
Valoracin por parte de jueces

expertos de la correspondencia
contenido-concepto.
Anlisis de la consistencia interna de

la prueba.
Estudio
de
las
variables
intervinientes en la calificacin.
Anlisis factorial y correlacin con

otras pruebas.
Anlisis de las respuestas.
Correlaciones
altas
con
otras
medidas o mtodos para medir el
mismo
constructo
(Validez
convergente).
Correlaciones bajas con las medidas

de constructos diferentes (Validez
discriminante).
CONSTRUCCIN DE LOS
TEMS
La Taxonoma de Bloom
1.
2.
3.
4.
5.
6.
El dominio cognoscitivo comprende

6 categoras:
Recuerdo
Comprensin
Aplicacin
Anlisis
Sntesis
Evaluacin
Recuerdo:
Incluye situaciones de examen que acentan
la importancia del recuerdo de datos, ideas,
materiales o fenmenos, ya sea como
reconocimiento o evocacin. Supone, el
recuerdo o reconocimiento de: Datos
especficos como terminologas o hechos;
modos y medios para el tratamiento de datos
especficos
como
convenciones,
clasificaciones, metodologas, tcnicas o
procedimientos y, universales y abstracciones
en un campo determinado como principios,
generalizaciones,
teoras
y
estructuras
(Herrera, 2003).
Ejemplo 1: Pregunta que evala Recuerdo
A continuacin encontrar preguntas que constan de
un enunciado y cuatro (4) o cinco (5) opciones de
respuesta. Usted debe marcar en su hoja de
respuesta, aquella opcin que considere correcta.
El modelo de control social propuesto por Max Weber
para las organizaciones, se denomina modelo:
A.- de los sistemas
B.- burocrtico
C.- estructuralista
D.- de las organizaciones
Comprensin:
Implica la inteleccin y fraccionamiento de un mensaje.
Operacionalmente se define como cualquier conducta
que vaya desde la presentacin de una proposicin con
palabras distintas de las del enunciado original, hasta la
aplicacin de un principio en una situacin nueva para el
examinado, pasando por la ejemplificacin. Se define en
trminos de tres operaciones: a) Traduccin o capacidad
para expresar un concepto o mensaje conocido en
palabras diferentes o pasarlo de un sistema simblico a
otro, b) Interpretacin o reordenamiento de ideas de una
comunicacin en una nueva configuracin. Incluye la
habilidad para captar el contenido de una comunicacin
como un todo y distinguir entre conclusiones legtimas y
contradictorias y c) Extrapolacin o hacer explcitas
algunas conclusiones, colorarios, consecuencias o efectos
de una comunicacin dada (Herrera, 2003).
Ejemplo 2: Pregunta que evala Comprensin
Si un psiclogo afirma que una prueba que ha preparado
para seleccin de personal tiene un coeficiente de validez
predictiva mas alto que el de fiabilidad, concluira que
A. est bien, por cuanto lo mas importante para la
seleccin es la validez de prediccin
B. debera tener mas alta fiabilidad que validez ya que lo
principal es la confianza en el instrumento
C. debe tener un error ya que la validez predictiva NO
puede ser mayor al coeficiente de fiabilidad
D. debe tener un error ya que los dos coeficientes, el de
validez y el de fiabilidad deben tener igual valor
E. no debera utilizar la prueba ya que debe tener mas alta
fiabilidad que validez para el objeto propuesto
Aplicacin:
Se refiere a la capacidad para aplicar teoras, principios,

mtodos o ideas en la solucin de un problema prctico.
Es la habilidad para aplicar principios y generalizaciones
a nuevos problemas y situaciones. Comprende entonces
tareas
como
a)
identificar
los
principios
o
generalizaciones apropiados para resolver un problema
o reformularlo para lograr tal identificacin, b)
especificar los lmites dentro de los cuales un principio o
generalizacin es verdadero o relevante y reconocer las
excepciones a los mismos y las razones para ello, c)
explicar nuevos fenmenos a partir de principios o
generalizaciones conocidas, predecir lo que suceder en
una situacin nueva mediante el uso de principios y
generalizaciones apropiadas, y d) determinar o justificar
una decisin o accin en una situacin usando principios
o generalizaciones e indicar el razonamiento que apoya
la utilizacin de los mismos ante un determinado
problema (Herrera 2003).
Ejemplo 3: Pregunta que evala Aplicacin
Escoja la caracterstica del pensamiento infantil que mejor se
ajusta a la conducta descrita por Piaget:
- Cmo se hace para tener madera? Se cortan los troncos de
los rboles.
- Qu se hace para tener rboles? Se siembran los granos. Y los granos? Se compran.
- Dnde? En los almacenes.
- Y el dueo del almacn?
Pinsalo un poco. Los hace.
- Con qu? Con otros granos. - Cuando vinieron los
primeros hombres, haba ya rboles? No.
- Cmo han comenzado? Por los granos. - De dnde venan
estos granos? Del almacn.
A.
B.
C.
D.
E.
Realismo
Animismo
Artificialismo
Sincretismo
Funcionalismo
Anlisis:
Hace referencia a la habilidad para fraccionar una

comunicacin en sus elementos, de manera que aparezcan
explcitas la jerarqua de las ideas y las relaciones existentes
entre ellas. Esta es un proceso complejo que implica las tres
categoras anteriores; recuerdo, comprensin y aplicacin,
pero va mas all de ellas. Aqu se incluyen tres subcategoras:
a) anlisis de elementos o habilidad para fraccionar una
informacin en sus elementos, como supuestos no explcitos,
hechos e hiptesis; b) anlisis de relaciones o identificar la
relaciones que existen entre los elementos de una
comunicacin; inferir los criterios, relaciones, cualidades,
suposiciones o condiciones implcitas en una comunicacin; o
bien, determinar las relaciones entre las hiptesis y las
pruebas que la apoyan, entre las conclusiones y las hiptesis,
o entre las conclusiones y las evidencias; y c) anlisis de
principios de organizacin que es la habilidad para explicitar
los principios organizadores que ha seguido un autor, reducir
su propsito, su punto de vista, su actitud o su interpretacin
(Herrera 2003).
Ejemplo 4: Pregunta que evala Anlisis
Considere los resultados del siguiente estudio:
En una investigacin sobre heredabilidad de rasgos psicosociales, en
este caso la criminalidad, se conformaron tres grupos de sujetos as:
el grupo A por parejas de gemelos univitelinos, el grupo B por parejas
de gemelos bivitelinos y el grupo C por parejas de hermanos
naturales. En ningn caso los hermanos fueron separados. Una vez
aplicados los instrumentos de medida (cuestionarios, encuestas,
etc.,), se encontraron los siguientes porcentajes de acuerdo en
relacin con la presencia de conductas criminales:
GRUPOS
A B C
% DE ACUERDO 77 35 8
Escoja la interpretacin que mejor se ajuste a los datos de la
investigacin
A. A mayor concordancia gentica corresponde un mayor
porcentaje de acuerdo
B. La criminalidad depende del medio ambiente en un 23%.
C. El bajo porcentaje registrado por el grupo C se debe a que es el
grupo con el menor nivel de homogeneidad gentica
D. No se puede concluir en favor de la heredabilidad de las
Sntesis:
Es la capacidad para reunir diferentes elementos o
partes para formar un todo. Esto es, la habilidad
para combinar elementos con el fin de constituir
una estructura o esquema que no estaba presente
con claridad. La capacidad de sntesis incluye: a)
produccin de una comunicacin nica, b)
produccin de un plan o conjunto de operaciones
con un fin determinado y c) derivacin de un
conjunto de relaciones abstractas, explicaciones o
hiptesis para dar cuenta de un fenmeno dado. Es
difcil construir preguntas estructuradas que
evalen esta categora, son mucho ms frecuentes
las preguntas abiertas de tipo ensayo (Herrera
2003).
Evaluacin:
Es la capacidad para emitir juicios sobre ideas,
obras, mtodos, materiales o soluciones, con algn
propsito determinado. Esta categora incluye
formulacin de juicios: a) con base en pautas
internas como exactitud, precisin y cuidado con
que ha sido elaborada una comunicacin dada;
consistencia de los razonamientos, relaciones entre
supuestos, evidencias y conclusiones y reconoci
miento de los valores y puntos de vista utilizados
en un juicio particular sobre una obra b) en
trminos de criterios externos como comparacin
de un trabajo u obra con otros, utilizando criterios o
normas explcitas. Al igual que en la categora
anterior, es difcil construir preguntas estructuradas
que evalen esta categora, son ms apropiadas las
preguntas abiertas de tipo ensayo (Herrera 2003).
Tipos de Preguntas
NOMBRE
ELEMENTOS
CARACTERISTICAS
Eleccin
mltiple
con nica
respuesta
Un enunciado y cuatro
o cinco opciones
de respuesta
Slo una de las opciones completa correctamente el enunciado. Puede

utilizarse para evaluar cualquier objetivo educativo especialmente
recuerdo, comprensin y aplicacin.
Eleccin
mltiple
con
mltiple
respuesta
Un enunciado y cuatro
(4) opciones de
respuesta
Una, dos, tres o todas las opciones de respuesta pueden completar

correctamente el enunciado, el examinado debe elegir una
combinacin de ellas. Adecuado para evaluar cualquier objetivo
educativo.
Un problema y dos
informaciones
relacionadas con el
mismo
Una o las dos informaciones pueden ser necesarias y suficientes para

resolver el problema o pueden ser necesarias pero no suficientes. El
evaluado no debe resolver el problema, slo evaluar la informacin
disponible. Excelente para evaluar aplicacin.
Una afirmacin y dos

postulados
Tanto la afirmacin como los postulados son VERDADEROS. El

examinado evala la relacin lgica entre ellos. Excelente para
evaluar anlisis.
Dos afirmaciones
separadas por la
palabra PORQUE
Tanto la afirmacin como la razn pueden ser VERDADERAS o FALSAS.

El examinado evala tanto su valor de verdad como la relacin lgica
entre ellas. Excelente para evaluar anlisis.
Informacin
suficiente
Anlisis de
postulado
s
Anlisis de
relaciones
Eleccin Mltiple con nica

Respuesta
Es el tipo de pregunta ms conocido y usado en las
pruebas objetivas. Estn conformadas por un
enunciado y cuatro (4) o cinco (5) opciones de
respuesta. El enunciado puede contener una frase
incompleta, una interrogacin, un texto o una grfica;
las opciones de respuesta aparecen identificadas con
las letras A, B, C, D y E. Una sola de las opciones
completa o responde correctamente el enunciado.
Este tipo de pregunta es til para evaluar cualquiera
de las cuatro primeras categoras de la taxonoma de
Bloom. Los ejemplos 1 a 4 son preguntas de eleccin
mltiple con nica respuesta.
Eleccin Mltiple con nica

Respuesta
Adems de las consideraciones generales sobre
construccin de preguntas, en este tipo de
tems es altamente recomendable evitar
expresiones como TODAS LAS ANTERIORES o
NINGUNA DE LAS ANTERIORES. Si ms de una
opcin es correcta probablemente la pregunta
quede mejor formulada con el formato de
eleccin mltiple con mltiple respuesta.
Eleccin Mltiple con Mltiple

Respuesta
Este tipo de pregunta consta de un enunciado y
cuatro (4) opciones de respuesta identificadas
con los nmeros 1, 2, 3 y 4. Una o varias
opciones
de
estas
pueden
completar
correctamente el enunciado. Este tipo de
pregunta es til para evaluar cualquiera de las
categoras
de
objetivos
educativos.
Sin
embargo, se usa frecuentemente para evaluar
comprensin y aplicacin utilizando: a) una
situacin en la que es necesario considerar
varias consecuencias posibles, b) una situacin
en la que es necesario especificar una o ms
condiciones para definirla adecuadamente, c)
dos situaciones semejantes o dismiles con
respecto a uno o ms puntos de comparacin,

Respuesta
Las instrucciones que se dan al examinado son,
generalmente de la siguiente forma:
"A continuacin encontrar preguntas que
constan de un enunciado y cuatro (4) opciones
de respuesta. Una o varias opciones pueden
completar correctamente el enunciado. Usted
debe marcar su hoja de respuestas segn el
cuadro siguiente:
Marque
Marque
Marque
Marque
A
B
C
D
si
si
si
si
las opciones 1, 2 y 3 son correctas

las opciones 1 y 3 son correctas
las opciones 2 y 4 son correctas
slo la opcin 4 es correcta

Respuesta
Este tipo de pregunta no debe incluir
distractores mutuamente excluyentes por
cuanto estaran anulando una o varias opciones
de respuesta; tampoco debe incluir en las
opciones de respuesta expresiones como TODAS
LAS
ANTERIORES
o
NINGUNA
DE
LAS
ANTERIORES.

Respuesta
Ejemplo:
La investigacin emprica ha encontrado que:
1. Las personas toman menos tiempo en el
aprendizaje de un concepto cuando hay muchos
atributos irrelevantes
2. En el aprendizaje de un concepto son mejores los
ejemplos negativos que los positivos
3. En el aprendizaje de un concepto la velocidad de
aprendizaje es una funcin directa del nmero de
atributos
4. Las personas toman ms tiempo en el aprendizaje
de un concepto cuando hay muchos atributos
relevantes
Informacin Suficiente
Estas preguntas constan de un problema y
dos informaciones identificadas con los
nmeros I y II. No se requiere que el
examinado resuelva el problema, sino que
decida si las informaciones proporcionadas
son necesarias y suficientes para resolverlo.
Este tipo de pregunta es muy til para
evaluar aplicacin.
Las instrucciones son, generalmente, las siguientes:
"Las preguntas que encontrar a continuacin
constan de un problema y dos informaciones
identificadas con los nmeros I y II. Usted debe
decidir si las informaciones son necesarias y
suficientes para solucionar el problema y marcar su
hoja de respuestas segn el cuadro siguiente: ...
Marque
y II
Marque
Marque
Marque
sirve
A s necesita y basta con las informaciones I

B si necesita y basta con la informacin I
C si necesita y basta con la informacin II
D si cualquiera de las dos informaciones
Adems de las normas generales, para la
construccin de este tipo de preguntas es
necesario tener en cuenta: a) las informaciones
NO deben ser contradictorias entre s o
mutuamente excluyentes, b) en las preguntas
de clave A, el problema debe poder
solucionarse con las dos informaciones sin
requerir de otra, c) en las preguntas de clave B,
C o D, el problema planteado debe poder
solucionarse con una sola informacin y d) en
las preguntas de clave E las informaciones
deben ser necesarias pero NO suficientes para
resolver el problema.
Ejemplo 6: Pregunta de Informacin Suficiente
Se quiere comparar el tiempo de reaccin ante
un estmulo en dos poblaciones. Se toman
muestran aleatorias de las poblaciones, se
recogen los datos y se elige un estadstico de
prueba. Para decidir si se acepta o rechaza una
hiptesis de igualdad de medias con un nivel de
significancia , se requiere conocer:
I. la distribucin del estadstico de prueba
II. la probabilidad de obtener un valor mayor
que el observado en el estadstico de prueba
Anlisis de Postulados
Este tipo de pregunta consta de una afirmacin

y dos postulados identificados con los nmeros I
y II. Entre la afirmacin y los postulados se
encuentra la palabra POR CONSIGUIENTE. Para
responder este tipo de pregunta el examinado
no necesita evaluar el valor de verdad de las
afirmaciones, todo se supone verdadero; solo
debe analizar la relacin lgica existente entre
afirmacin y postulados. Es un tipo de pregunta
de difcil elaboracin y requiere de cuidadoso
anlisis previo para que la respuesta sea
inequvoca. Es muy adecuado para evaluar
anlisis.
Las instrucciones para responder este tipo de
pregunta son, generalmente, como se muestra a
continuacin
"Las preguntas que encontrar a continuacin
constan de una afirmacin VERDADERA y dos
postulados tambin VERDADEROS identificados con
los nmeros I y II. Usted debe decidir si los postula
dos se deducen lgicamente de la afirmacin y
contestar segn el cuadro siguiente: ...
Marque
II
Marque
Marque
Marque
la tesis
A s de la tesis se deducen los postulados I y

B si de la tesis solo se deduce el postulado I
C si de la tesis solo se deduce el postulado II
D si ninguno de los postulados se deduce de
Ejemplo 7: Pregunta de Anlisis de
Postulados
Es inimputable quien comete el delito bajo
influencia determinante de un trastorno
mental
POR CONSIGUIENTE
I. Un psictico puede ser inimputable
II. Un inimputable comete un hecho tpico
y antijurdico pero no culpable ni punible
Adems de las normas generales, para la construccin

de este tipo de preguntas es necesario tener en
cuenta: a) aun cuando la instruccin le indica al
examinado que debe suponer todo verdadero, es
recomendable que las afirmaciones lo sean en efecto
o, por lo menos que no sean absurdos u obviamente
falsos, b) todas las afirmaciones deben ser
gramaticalmente completas e independientes unas de
otras, c) la construccin de la pregunta debe ser tal
que la deduccin lgica sea indiscutible, de manera
que la respuesta correcta sea inequvoca y d) este tipo
de pregunta es til para poblaciones de alto nivel
educativo.
Anlisis de Relaciones
Las preguntas de este tipo presentan dos

afirmaciones unidas por la palabra PORQUE y la
segunda afirmacin se considera una RAZON
verdadera o supuesta de la primera. El examinado
debe evaluar tanto el valor de verdad de las
afirmaciones como la relacin entre ellas. A
diferencia de las preguntas de anlisis de
postulados, en stas las afirmaciones pueden ser
verdaderas o falsas. Este tipo de preguntas es
particularmente til para evaluar anlisis y presenta
menos dificultades prcticas que la pregunta de
anlisis de postulados.
Las preguntas que encontrar a continuacin constan
de una afirmacin y una razn unidas por la palabra
PORQUE. Usted debe juzgar tanto el grado de verdad o
falsedad de cada una de ellas como la relacin existente
entre las mismas, y contestar en su hoja de respuestas
segn el cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la
segunda es una razn o explicacin correcta de la
primera
Marque B si ambas afirmaciones son verdaderas pero
la segunda NO es una razn o explicacin correcta de la
primera
Marque C si la primera afirmacin es verdadera pero la
segunda es falsa
Marque D si la primera afirmacin es falsa pero la
segunda es verdadera
Marque E si ambas afirmaciones son falsas
Las preguntas que encontrar a continuacin
constan de una afirmacin y una razn unidas por la
palabra PORQUE. Usted debe juzgar tanto el grado
de verdad o falsedad de cada una de ellas como la
relacin existente entre las mismas, y contestar en
su hoja de respuestas segn el cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la
segunda es una razn o explicacin correcta de la
primera
Marque B si ambas afirmaciones son verdaderas
pero la segunda NO es una razn o explicacin
correcta de la primera
Marque C si la primera afirmacin es verdadera
pero la segunda es falsa
Marque D si la primera afirmacin es falsa pero la
segunda es verdadera
Marque E si ambas afirmaciones son falsas
Para la construccin de este tipo de

preguntas es necesario tener en cuenta: a)
las afirmaciones no deben ser obviamente
falsas u obviamente verdaderas, b) las
afirmaciones no deben ser contradictorias
entre s o mutuamente excluyentes y c) las
afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o
falsedad independientemente, es decir,
deben
ser
frases
gramaticalmente
completas.
Para la construccin de este tipo de

preguntas es necesario tener en cuenta: a)
las afirmaciones no deben ser obviamente
falsas u obviamente verdaderas, b) las
afirmaciones no deben ser contradictorias
entre s o mutuamente excluyentes y c) las
afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o
falsedad independientemente, es decir,
deben
ser
frases
gramaticalmente
completas.
Ejemplo 8: Pregunta de Anlisis de Relaciones
El hemisferio cerebral izquierdo regula las
contracciones musculares del lado derecho
del cuerpo
PORQUE
las fibras motoras y sensitivas se cruzan en
el bulbo
ANLISIS DE LOS TEMS
Estimacin de la Dificultad del tems

xito en la estimacin en contextos variados
Propiedades del sujeto

tems
Halo
Juicios Subjetivos
Calificacin
Administracin
Rapport
Propiedades de los
Azar
Covarianza con la prueba
(Homogeneidad)
Frecuencia de cada opcin
Dificultad
Discriminacin
Correlacin con la prueba
INDICE DE DIFICULTAD
Indica la proporcin de aciertos en la muestra de

alumnos que estamos utilizando. Es la media de
ste 50% de sujetos analizados.
El trmino de dificultad se presta a equvocos: in

ndice mayor indica un pregunta mas fcil.
Este ndice de dificultad sirve para evaluar

cuatro variables:
La complejidad de la habilidad medida.
Las caractersticas del logro del grupo.
La comparacin de distintos reactivos que miden
la misma habilidad.
La comparacin de reactivos que miden la
misma habilidad pero con una relacin
jerrquica.
1.
2.
3.
4.
INDICE DE DIFICULTAD
Se fija un mnimo valor aceptable de p = 0.5 para
considerar el reactivo bueno, cualquier medida
inferior a 0.5, aunque no quiere decir que el reactivo
no sirve, es mejor no usarlo porque podra ser que lo
que est mal son las instrucciones.
Criterios para calificar la dificultad de los reactivos

de acuerdo al valor del ndice de dificultad de los
reactivos p.
Muy difcil
fcil
0% - 49%
Optima
50% - 69%
Ligeramente fcil
70% - 89%
Muy
90% - 100%
INDICES DE DISCRIMINACION
Los ndices de discriminacin expresan en que

medida cada pregunta o tem diferencia a los
que mas saben de los que menos saben.
Es el ndice probablemente ms utilizado.

Expresa hasta que punto la pregunta
discrimina, establece diferencias, contribuye a
situar a un sujeto en el grupo superior e
inferior.
A mayor diferencia, en numero de acertantes

entre los grupos superior e inferior, el tem es
mas discriminante, contribuye mas a situar a
un sujeto entre los primeros o entre los
ltimos.
Las preguntas muy fciles y muy difciles

no discriminan, no establecen diferencias;
nos dicen que todos saben o no saben una
pregunta, pero no quien sabe mas y quien
menos. Estas preguntas no contribuyen a
la fiabilidad del test, pero eso no quiere
decir necesariamente que sean malas
preguntas.
Si todos y solos los del grupo superior

responden correctamente, tendremos que:
ID=1.
Si todos y solos los del grupo inferior

responden correctamente, tendremos que:
ID= -1.
Si el ID es menor de 0.30 el tem

debe
eliminarse
porque
no
discrimina, an cuando su nivel de
dificultad sea ptimo.
Si el tem tiene un ID igual o superior

a 0.30 y su nivel de dificultad no es
ptimo debe entonces corregirse y
mejorarse ya que discrimina y puede
considerarse como un tem adecuado
para la prueba.
A mayor valor,
mayor poder discriminativo.
Forma de calcular D y P
1.
2.
Procedimiento:
Hallar los puntajes totales por sujeto.
Ordenarlos de mayor a menor o al revs.
Nos interesan los puntajes extremos
(27% de bajos) y (27% de altos) y los
puntajes promedio no sirven para el
anlisis, se ocultan. Por ejemplo, si hay
100 datos el 27% serian 27 datos y si
fueran 70 datos el 27% seria equivalente
a 18 datos.
3.
4.
Calcular el nmero de sujetos del grupo

de los altos que responde correctamente
bien cada tem y calcular el nmero de
sujetos del grupo de los bajos que
responde bien cada tem.
Identificar el ndice de dificultad por la
formula:
P = nG(altos)A + nG(bajos)B
G(total)A + G(total)B
y el ndice de dificultad con la formula:
D = GA + GB
G(total).

Psi Come Tra

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Psi Come Tra

Caricato da

Copyright:

Formati disponibili

PSICOMETRA

En China se utilizan tests para acceder a puestos en el gobierno.

Thurstone publica su libro The reliability and validity of tests.

Wechsler propone su escala de medida para la inteligencia.

Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de

Diferencia entre psicometra y

Hacia el ao 1115 a.C. se utilizan comienzan a

En 1869 Francis Galton publica el libro Genio

Entre 1904 y 1910 Charles Spearman

En 1905 Alfredo Binet y Theodore Simon

En 1960 Lee Cronbach propone su Teora

En 1980 Rasch plantea la Teora de la

Teora clsica de los Tests

El modelo de puntuacin verdadera se

El error de medida se establece como la

La puntuacin verdadera se obtiene con el

Si en una poblacin se conocen las

Si en una poblacin conociramos los

Si en una poblacin conociramos las

Las caractersticas de los tems (dificultad y

La puntuacin que una persona obtenga ser

La TCT supone que el error de medida es una

Unidimensionalidad: todos los tems que forman el

No hay como tal puntuaciones verdaderas sino una

Independencia local: entre los tems de un test si la

Un prueba psicolgica o test

Es un instrumento en formato impreso o

Puede aplicarse en diferentes campos de

Estructura general de un test

Tabla de puntuaciones y baremos.

Es un documento que consta de:

La hoja de respuestas y plantilla de

Es la hoja donde la persona anota las

Una vez que la persona entrega la hoja de

Una vez que se han obtenido los aciertos y

Esa puntuacin bruta se analiza en la tabla

Son tablas de puntuaciones estndar que

Por ejemplo, para una misma prueba

Tipos de pruebas o tests

Clasificacin de las pruebas por

Pruebas de autoaplicacin: son tests que no

Pruebas de aplicacin individual: son aquellas

Pruebas de aplicacin grupal: son aquellas que el

Clasificacin de las pruebas segn la

Pruebas de desempeo: miden el rendimiento

Pruebas de poder: miden el nivel de destreza

Pruebas de velocidad: miden cuantos tems

Pruebas con referencia a la norma o al criterio:

Clasificacin de las pruebas segn las

Pruebas de actitudes, aptitudes, intereses,

Enunciado: menciona las instrucciones para

Pregunta(s): son cuestionamientos que evalan

Clasificacin del formato de

Clasificacin de las respuestas en

Eleccin binaria: de dos alternativas, se

Eleccin mltiple: entre ms de dos

Emparejamiento: consiste en encontrar las

Clasificacin de las respuestas en

Opcin binaria: la persona debe manifestar si

Categoras ordenadas: el formato establece un

Adjetivos bipolares: este formato es tpico de lo

Es el grado en el cual las mediciones

Permite predecir el desempeo de un