Sei sulla pagina 1di 88

PSICOMETRA

Diseado por:
Germn Andrs Torres
Escobar

Hitos en la historia de la
psicometra
AO

HITO O ACONTECIMIENTO

1115 a.C.

En China se utilizan tests para acceder a puestos en el gobierno.

1869 d C.

Francis Galton publica el libro Genio Hereditario (1869) donde plantea a travs
de estudios estadsticos que la inteligencia se hereda.

1904 1910 d. C.

Charles Spearman funda la Teora Clsica de los tests o del modelo lineal
y publica su teora de los factores de la inteligencia y las formulas de atenuacin.

1905 d.C.

Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios,
con el fin de establecer su edad mental y predecir su rendimiento acadmico.

1918 d.C.

Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados
durante la Primera Guerra Mundial y Robert Woodworth elabor el primer Personal
Data Sheet para detectar los soldados que pudieran tener crisis nerviosas.

1931 d.C.

Thurstone publica su libro The reliability and validity of tests.

1939 d.C.

Wechsler propone su escala de medida para la inteligencia.

1940 d.C.

Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality


Inventory (MMPI).

1960 d.C.

Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de


varianza para interpretar las fuentes de error en los puntajes.

1980 d.C.

Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite
conocer la informacin de cada tem para disear pruebas individualizadas.

La psicometra

Es la rama de la
psicologa
que
desarrolla y estudia
las propiedades de
las
pruebas
psicolgicas o tests
para
medir
las
variables
psicolgicas con la
mayor
precisin
posible.

Diferencia entre psicometra y


evaluacin psicolgica
Psicometra

nfasis en la
medicin

Instrumentos y tests

Evaluacin
psicolgica

nfasis en el
diagnstico

La persona

Historia de la psicometra
Antecedentes

Modelos

histricos.

de medicin.

Antecedentes histricos

Hacia el ao 1115 a.C. se utilizan comienzan a


utilizar en China los primeros tests que buscan
medir las capacidades de aspirantes para acceder
a puestos del gobierno (primera medicin de
capacidades).

En 1869 Francis Galton publica el libro Genio


Hereditario donde plantea a travs de estudios
estadsticos que la inteligencia se hereda y que
es posible medirla (estudios estadsticos en
psicologa).

Entre 1904 y 1910 Charles Spearman


funda la Teora Clsica de los tests o del
modelo lineal y publica su teora de los
factores de la inteligencia y las formulas
de atenuacin (Estrategias de medicin
y TCT).

En 1905 Alfredo Binet y Theodore Simon


publican la primera escala de inteligencia
para nios, con el fin de establecer su
edad mental y predecir su rendimiento
acadmico (uno de los primeros tests
psicolgicos).

En 1960 Lee Cronbach propone su Teora


de la Generalizacin en la cual utiliza el
anlisis de varianza para interpretar las
fuentes de error en los puntajes.
Igualmente l desarroll estrategias para
la medicin de la confiabilidad de un test.

En 1980 Rasch plantea la Teora de la


Respuesta al tem o del rasgo latente que
permite conocer la informacin de cada
tem
para
disear
pruebas
individualizadas.

Modelos de medicin
Teora Clsica de
los Tests (TCT)

Anlisis de la prueba
completa

En una muestra
pequea de sujetos (N
< 500)

Teora de la Respuesta
al tem (TRI)

Anlisis de tems
individuales

En grandes muestras
de sujetos (N 500)

Teora clsica de los Tests

El modelo de puntuacin verdadera se


concreta en un primer supuesto:
X=V+E
que indica que la puntuacin emprica
directa de una persona en un test (X) est
compuesta por la puntuacin verdadera de la
persona (V) y un error de medida (E) que se
comete al medir el rasgo con el test.

El error de medida se establece como la


diferencia entre la puntuacin emprica y la
verdadera:
E=X-V

La puntuacin verdadera se obtiene con el


promedio de las puntuaciones empricas que
obtiene la persona en un nmero elevado de
aplicaciones del test:
V = E[X]

Si en una poblacin se conocen las


puntuaciones V y E de los individuos, la
correlacin entre ambas variables sera nula,
porque
se
asume
que
puntuaciones
verdaderas elevadas no tienen porqu tener
asociados errores elevados:
r VE = 0

Si en una poblacin conociramos los


errores de medida de cada individuo quien
ha realizado dos tests diferentes (j y k), la
correlacin entre ambas variables tambin
sera nula:

E jEk = 0

Si en una poblacin conociramos las


puntuaciones E en un test j y las
puntuaciones V en un test k, ambas
variables correlacionaran cero:

E jVk = 0

Limitaciones de la Teora
Clsica

Las caractersticas de los tems (dificultad y


discriminacin) dependen del grupo de personas
en el que se han aplicado.

La puntuacin que una persona obtenga ser


diferente si se le aplican dos tests que midan la
misma caracterstica pero cuyo nivel de dificultad
sea diferente.

La TCT supone que el error de medida es una


propiedad del test y, por lo tanto, igual para todos
los sujetos, independientemente de cual sea su
puntuacin.

Teora de la Respuesta al
tem

Unidimensionalidad: todos los tems que forman el


test han de medir un mismo y nico rasgo. El
supuesto de unidimensionalidad exige que todos y
cada uno de los tems del test midan una nica
dimensin.

No hay como tal puntuaciones verdaderas sino una


probabilidad de acierto determinada por unos
parmetros.

Independencia local: entre los tems de un test si la


respuesta que una persona da a uno de ellos no
depende de las respuestas que da a los otros, ni por el
orden de presentacin de los tems, las respuestas
que ya se hayan dado, etc.

Un prueba psicolgica o test

Es un instrumento en formato impreso o


digital que consta de una serie de
preguntas o reactivos que miden unas
variables psicolgicas especificas a travs
de un sistema de puntuacin.

Puede aplicarse en diferentes campos de


la psicologa, para fines diversos como
diagnstico clnico (psicologa clnica) ,
seleccin
de
personal
(psicologa
organizacional) o anlisis de aptitudes
vocacionales (psicologa educativa).

Estructura general de un test


impreso

Cuadernillo de instrucciones.

Cuadernillo de preguntas.

Hoja(s) de respuestas.

Plantilla de correccin.

Tabla de puntuaciones y baremos.

El cuadernillo de
instrucciones

Es
un
documento
donde
se
menciona:
El nombre de la prueba, sus autores
y el ao de publicacin.
La(s) variable(s) que mide y sus
objetivos.
Los antecedentes (marco conceptual
y terico) de la prueba.
Las instrucciones generales de

El cuadernillo de preguntas

Es un documento que consta de:


Las instrucciones de respuesta (para quien
la va a responder).
Los tems o preguntas.
No puede rayarse ni se puede escribir
sobre este ya que se usa en diferentes
aplicaciones.

La hoja de respuestas y plantilla de


correccin

Es la hoja donde la persona anota las


respuestas a de los tems planteados en el
cuadernillo de preguntas.

Una vez que la persona entrega la hoja de


respuestas al psiclogo, l o ella la
califican poniendo encima de la hoja de
respuestas, la plantilla de correccin para
ver en cuales acert el sujeto y en cuales
no.

El sistema de puntuacin

Puntuacin cruda o
bruta

La tabla de puntuaciones y
baremos

Una vez que se han obtenido los aciertos y


errores de la persona con ayuda de la
plantilla, se obtiene una puntuacin
cruda o bruta, que es especifica para ese
sujeto.

Esa puntuacin bruta se analiza en la tabla


de puntuaciones estndar, para obtener
una puntuacin estndar o tpica del
sujeto dentro de la poblacin o muestra de
sujetos que present la prueba (baremo).

Los baremos

Son tablas de puntuaciones estndar que


se clasifican por grupos poblacionales o
muestrales segn la edad, profesin o
gnero.

Por ejemplo, para una misma prueba


existen baremos para hombres, mujeres,
hombres
profesionales,
mujeres
profesionales, estudiantes de secundaria,
etc.

Tipos de pruebas o tests

Clasificacin de las
pruebas

Clasificacin de las pruebas por


aplicacin

Pruebas de autoaplicacin: son tests que no


requieren la aplicacin por parte de un psiclogo
sino que puede hacerlas la persona con ayuda de
un computador.

Pruebas de aplicacin individual: son aquellas


que el psiclogo administra a una sola persona.
Por ejemplo, en un caso clnico.

Pruebas de aplicacin grupal: son aquellas que el


psiclogo pueden aplicar a varias personas al
mismo tiempo, pero controlando que no
conversen entre ellas. Por ejemplo, una prueba
de aptitudes e intereses vocacionales.

Clasificacin de las pruebas segn la


forma de medir la(s) variable(s)

Pruebas de desempeo: miden el rendimiento


mximo (individual) o el rendimiento normal o
tpico (de un grupo).

Pruebas de poder: miden el nivel de destreza


mental de un sujeto o su nivel de conocimiento.

Pruebas de velocidad: miden cuantos tems


responde el sujeto en un tiempo especifico.

Pruebas con referencia a la norma o al criterio:


mide la variables psicolgica segn objetivos
especficos.

Clasificacin de las pruebas segn las


variables que miden

Pruebas
de
(inteligencia).

capacidad

mental

Pruebas
de
conocimiento.

Pruebas de personalidad.

Pruebas de actitudes, aptitudes, intereses,


motivacin, opinin y valores.

Pruebas neuropsicolgicas.

aprovechamiento

Estructura general de un
tem

Enunciado: menciona las instrucciones para


contestar el tem y plantea un contexto o
situacin a partir del cual se hace la pregunta.

Pregunta(s): son cuestionamientos que evalan


directamente la variable psicolgica de forma
implcita. Pueden ser abiertas (libre respuesta) o
cerradas (opciones especificas).

Opciones
de
respuesta:
incluyen
una(s)
respuestas(s) correcta(s) y un(os) distractor(es) o
respuesta(s) falsa(s).

Clasificacin del formato de


respuestas

Clasificacin de los
tems

Clasificacin de las respuestas en


tests de rendimiento ptimo

Eleccin binaria: de dos alternativas, se


elige la que se considera correcta (S o No)
o (verdadero-falso).

Eleccin mltiple: entre ms de dos


alternativas se elige la que se considera
correcta.

Emparejamiento: consiste en encontrar las


parejas entre dos conjuntos de conceptos.

Clasificacin de las respuestas en


tests de rendimiento tpico

Opcin binaria: la persona debe manifestar si


est de acuerdo o en desacuerdo con una
afirmacin.

Categoras ordenadas: el formato establece un


continuo ordinal de ms de dos categoras, que
permite a la persona matizar mejor su respuesta.

Adjetivos bipolares: este formato es tpico de lo


que se denomina "diferencial semntico".

Confiabilidad

Es el grado en el cual las mediciones


repetidas
de
un
fenmeno
relativamente
estable
son
aproximadas entre s o consistentes.

Permite predecir el desempeo de un


grupo o de un sujeto e igualmente
sirve para describirlo en ambos
casos.

Formas de medir la
confiabilidad

Test-retest: consiste en aplicar un test dos veces


a un mismo grupo en un intervalo de das o
meses (no superior).

Formas paralelas: consiste en aplicar un test


homologo o equivalente a un mismo grupo pero
en tiempos diferentes.

Divisin por mitades: consiste en comparar los


resultados de los tems pares e impares en la
aplicacin grupal de un test.

Coeficientes de
confiabilidad

Test-retest: coeficiente de estabilidad


(r).

Formas paralelas:
equivalencia (r).

Divisin por mitades: coeficiente de


consistencia interna (r).

coeficiente

de

Coeficientes ms usados en
divisin por mitades

Formas de mejorar la
confiabilidad de un test

Para calcular el nmero de tems K para


lograr una confiabilidad RXY deseada
(superior a 0.7) se usa la formula:
K = RXY * (1 rXY) / rXY) * (1 RXY)
donde rX es la confiabilidad inicial.
Una vez obtenido el nmero K se
multiplica por el nmero de items inicial y
luego se le resta a ese resultado el nmero
de tems inicial.

Para calcular la confiabilidad al quitar


un nmero de tems X con un total
de tems Y y con una confiabilidad
conocida C se usa la siguiente
formula:
YX/Y
El resultado obtenido con esta
formula debe operarse con la formula
2:
[resultado 1 * C]
[1 + (resultado 1 1) * C]

VALIDEZ

Es el grado en el cual una prueba


mide lo que pretende medir.

Conjunto de pruebas y datos que han


de recogerse para garantizar la
pertinencia predictiva de las
inferencias que hacen a partir de un
test.

Tipos de validez

Validez del contenido.

Validez con relacin a criterio.

Validez del constructo.

VALIDEZ DEL CONTENIDO

Es la muestra adecuada y representativa


de los contenidos que se pretende evaluar
con un test.

Los tems o preguntas se seleccionan


segn su:
Coherencia: con las caractersticas y
variables.
Relevancia: de acuerdo con el indicador.
Buena redaccin: la gramtica del tem.

VALIDEZ CON RELACIN AL


CRITERIO

Es la comparacin del desempeo de


un grupo de sujetos en un test
respecto patrones de medida ya
establecidos.

Se clasifica en:
Validez concurrente.
Validez predictiva.

Validez concurrente

Es el anlisis de variabilidad que


efecta al comparar el desempeo
de dos grupos de distintos de sujetos
en un mismo test.

Tambin se le denomina validez


cruzada o entre distintas muestras.

Validez predictiva

Es el grado de precisin con que las


calificaciones de la prueba predicen
las calificaciones del criterio.

Se obtiene mediante la correlacin


entre una variable de indicador y una
variable criterio a partir de r
(Pearson), cuyo valor es igual o
menor a 0,60.

Factores que afectan la validez


con relacin a los criterios

Las diferencias de grupo:


sexo, edad y rasgos de personalidad.
La contaminacin de los criterios:
evidencias falsas que les restan validez.

El ndice de base (debe ser mayor de 50):


nmero de personas que poseen la variable
medida.

El incremento de la validez:
costo razonable del instrumento.

VALIDEZ DEL CONSTRUCTO

Es el grado de exactitud con el que


se mide un constructo o concepto
psicolgico particular.

Depende de unas condiciones que


son externas al evaluador y la
persona que disea la prueba.

Condiciones de la
validez del constructo

Valoracin por parte de jueces


expertos de la correspondencia
contenido-concepto.

Anlisis de la consistencia interna de


la prueba.

Estudio
de
las
variables
intervinientes en la calificacin.

Anlisis factorial y correlacin con


otras pruebas.

Anlisis de las respuestas.

Correlaciones
altas
con
otras
medidas o mtodos para medir el
mismo
constructo
(Validez
convergente).

Correlaciones bajas con las medidas


de constructos diferentes (Validez
discriminante).

CONSTRUCCIN DE LOS
TEMS

La Taxonoma de Bloom

1.
2.
3.
4.
5.
6.

El dominio cognoscitivo comprende


6 categoras:
Recuerdo
Comprensin
Aplicacin
Anlisis
Sntesis
Evaluacin

La Taxonoma de Bloom
Recuerdo:
Incluye situaciones de examen que acentan
la importancia del recuerdo de datos, ideas,
materiales o fenmenos, ya sea como
reconocimiento o evocacin. Supone, el
recuerdo o reconocimiento de: Datos
especficos como terminologas o hechos;
modos y medios para el tratamiento de datos
especficos
como
convenciones,
clasificaciones, metodologas, tcnicas o
procedimientos y, universales y abstracciones
en un campo determinado como principios,
generalizaciones,
teoras
y
estructuras
(Herrera, 2003).

La Taxonoma de Bloom
Ejemplo 1: Pregunta que evala Recuerdo
A continuacin encontrar preguntas que constan de
un enunciado y cuatro (4) o cinco (5) opciones de
respuesta. Usted debe marcar en su hoja de
respuesta, aquella opcin que considere correcta.
El modelo de control social propuesto por Max Weber
para las organizaciones, se denomina modelo:
A.- de los sistemas
B.- burocrtico
C.- estructuralista
D.- de las organizaciones

La Taxonoma de Bloom
Comprensin:
Implica la inteleccin y fraccionamiento de un mensaje.
Operacionalmente se define como cualquier conducta
que vaya desde la presentacin de una proposicin con
palabras distintas de las del enunciado original, hasta la
aplicacin de un principio en una situacin nueva para el
examinado, pasando por la ejemplificacin. Se define en
trminos de tres operaciones: a) Traduccin o capacidad
para expresar un concepto o mensaje conocido en
palabras diferentes o pasarlo de un sistema simblico a
otro, b) Interpretacin o reordenamiento de ideas de una
comunicacin en una nueva configuracin. Incluye la
habilidad para captar el contenido de una comunicacin
como un todo y distinguir entre conclusiones legtimas y
contradictorias y c) Extrapolacin o hacer explcitas
algunas conclusiones, colorarios, consecuencias o efectos
de una comunicacin dada (Herrera, 2003).

La Taxonoma de Bloom
Ejemplo 2: Pregunta que evala Comprensin
Si un psiclogo afirma que una prueba que ha preparado
para seleccin de personal tiene un coeficiente de validez
predictiva mas alto que el de fiabilidad, concluira que
A. est bien, por cuanto lo mas importante para la
seleccin es la validez de prediccin
B. debera tener mas alta fiabilidad que validez ya que lo
principal es la confianza en el instrumento
C. debe tener un error ya que la validez predictiva NO
puede ser mayor al coeficiente de fiabilidad
D. debe tener un error ya que los dos coeficientes, el de
validez y el de fiabilidad deben tener igual valor
E. no debera utilizar la prueba ya que debe tener mas alta
fiabilidad que validez para el objeto propuesto

La Taxonoma de Bloom
Aplicacin:

Se refiere a la capacidad para aplicar teoras, principios,


mtodos o ideas en la solucin de un problema prctico.
Es la habilidad para aplicar principios y generalizaciones
a nuevos problemas y situaciones. Comprende entonces
tareas
como
a)
identificar
los
principios
o
generalizaciones apropiados para resolver un problema
o reformularlo para lograr tal identificacin, b)
especificar los lmites dentro de los cuales un principio o
generalizacin es verdadero o relevante y reconocer las
excepciones a los mismos y las razones para ello, c)
explicar nuevos fenmenos a partir de principios o
generalizaciones conocidas, predecir lo que suceder en
una situacin nueva mediante el uso de principios y
generalizaciones apropiadas, y d) determinar o justificar
una decisin o accin en una situacin usando principios
o generalizaciones e indicar el razonamiento que apoya
la utilizacin de los mismos ante un determinado
problema (Herrera 2003).

La Taxonoma de Bloom
Ejemplo 3: Pregunta que evala Aplicacin
Escoja la caracterstica del pensamiento infantil que mejor se
ajusta a la conducta descrita por Piaget:
- Cmo se hace para tener madera? Se cortan los troncos de
los rboles.
- Qu se hace para tener rboles? Se siembran los granos. Y los granos? Se compran.
- Dnde? En los almacenes.
- Y el dueo del almacn?
Pinsalo un poco. Los hace.
- Con qu? Con otros granos. - Cuando vinieron los
primeros hombres, haba ya rboles? No.
- Cmo han comenzado? Por los granos. - De dnde venan
estos granos? Del almacn.
A.
B.
C.
D.
E.

Realismo
Animismo
Artificialismo
Sincretismo
Funcionalismo

La Taxonoma de Bloom
Anlisis:

Hace referencia a la habilidad para fraccionar una


comunicacin en sus elementos, de manera que aparezcan
explcitas la jerarqua de las ideas y las relaciones existentes
entre ellas. Esta es un proceso complejo que implica las tres
categoras anteriores; recuerdo, comprensin y aplicacin,
pero va mas all de ellas. Aqu se incluyen tres subcategoras:
a) anlisis de elementos o habilidad para fraccionar una
informacin en sus elementos, como supuestos no explcitos,
hechos e hiptesis; b) anlisis de relaciones o identificar la
relaciones que existen entre los elementos de una
comunicacin; inferir los criterios, relaciones, cualidades,
suposiciones o condiciones implcitas en una comunicacin; o
bien, determinar las relaciones entre las hiptesis y las
pruebas que la apoyan, entre las conclusiones y las hiptesis,
o entre las conclusiones y las evidencias; y c) anlisis de
principios de organizacin que es la habilidad para explicitar
los principios organizadores que ha seguido un autor, reducir
su propsito, su punto de vista, su actitud o su interpretacin
(Herrera 2003).

La Taxonoma de Bloom
Ejemplo 4: Pregunta que evala Anlisis
Considere los resultados del siguiente estudio:
En una investigacin sobre heredabilidad de rasgos psicosociales, en
este caso la criminalidad, se conformaron tres grupos de sujetos as:
el grupo A por parejas de gemelos univitelinos, el grupo B por parejas
de gemelos bivitelinos y el grupo C por parejas de hermanos
naturales. En ningn caso los hermanos fueron separados. Una vez
aplicados los instrumentos de medida (cuestionarios, encuestas,
etc.,), se encontraron los siguientes porcentajes de acuerdo en
relacin con la presencia de conductas criminales:
GRUPOS
A B C
% DE ACUERDO 77 35 8
Escoja la interpretacin que mejor se ajuste a los datos de la
investigacin
A. A mayor concordancia gentica corresponde un mayor
porcentaje de acuerdo
B. La criminalidad depende del medio ambiente en un 23%.
C. El bajo porcentaje registrado por el grupo C se debe a que es el
grupo con el menor nivel de homogeneidad gentica
D. No se puede concluir en favor de la heredabilidad de las

La Taxonoma de Bloom
Sntesis:
Es la capacidad para reunir diferentes elementos o
partes para formar un todo. Esto es, la habilidad
para combinar elementos con el fin de constituir
una estructura o esquema que no estaba presente
con claridad. La capacidad de sntesis incluye: a)
produccin de una comunicacin nica, b)
produccin de un plan o conjunto de operaciones
con un fin determinado y c) derivacin de un
conjunto de relaciones abstractas, explicaciones o
hiptesis para dar cuenta de un fenmeno dado. Es
difcil construir preguntas estructuradas que
evalen esta categora, son mucho ms frecuentes
las preguntas abiertas de tipo ensayo (Herrera
2003).

La Taxonoma de Bloom
Evaluacin:
Es la capacidad para emitir juicios sobre ideas,
obras, mtodos, materiales o soluciones, con algn
propsito determinado. Esta categora incluye
formulacin de juicios: a) con base en pautas
internas como exactitud, precisin y cuidado con
que ha sido elaborada una comunicacin dada;
consistencia de los razonamientos, relaciones entre
supuestos, evidencias y conclusiones y reconoci
miento de los valores y puntos de vista utilizados
en un juicio particular sobre una obra b) en
trminos de criterios externos como comparacin
de un trabajo u obra con otros, utilizando criterios o
normas explcitas. Al igual que en la categora
anterior, es difcil construir preguntas estructuradas
que evalen esta categora, son ms apropiadas las
preguntas abiertas de tipo ensayo (Herrera 2003).

Tipos de Preguntas
NOMBRE

ELEMENTOS

CARACTERISTICAS

Eleccin
mltiple
con nica
respuesta

Un enunciado y cuatro
o cinco opciones
de respuesta

Slo una de las opciones completa correctamente el enunciado. Puede


utilizarse para evaluar cualquier objetivo educativo especialmente
recuerdo, comprensin y aplicacin.

Eleccin
mltiple
con
mltiple
respuesta

Un enunciado y cuatro
(4) opciones de
respuesta

Una, dos, tres o todas las opciones de respuesta pueden completar


correctamente el enunciado, el examinado debe elegir una
combinacin de ellas. Adecuado para evaluar cualquier objetivo
educativo.

Un problema y dos
informaciones
relacionadas con el
mismo

Una o las dos informaciones pueden ser necesarias y suficientes para


resolver el problema o pueden ser necesarias pero no suficientes. El
evaluado no debe resolver el problema, slo evaluar la informacin
disponible. Excelente para evaluar aplicacin.

Una afirmacin y dos


postulados

Tanto la afirmacin como los postulados son VERDADEROS. El


examinado evala la relacin lgica entre ellos. Excelente para
evaluar anlisis.

Dos afirmaciones
separadas por la
palabra PORQUE

Tanto la afirmacin como la razn pueden ser VERDADERAS o FALSAS.


El examinado evala tanto su valor de verdad como la relacin lgica
entre ellas. Excelente para evaluar anlisis.

Informacin
suficiente
Anlisis de
postulado
s
Anlisis de
relaciones

Eleccin Mltiple con nica


Respuesta
Es el tipo de pregunta ms conocido y usado en las
pruebas objetivas. Estn conformadas por un
enunciado y cuatro (4) o cinco (5) opciones de
respuesta. El enunciado puede contener una frase
incompleta, una interrogacin, un texto o una grfica;
las opciones de respuesta aparecen identificadas con
las letras A, B, C, D y E. Una sola de las opciones
completa o responde correctamente el enunciado.
Este tipo de pregunta es til para evaluar cualquiera
de las cuatro primeras categoras de la taxonoma de
Bloom. Los ejemplos 1 a 4 son preguntas de eleccin
mltiple con nica respuesta.

Eleccin Mltiple con nica


Respuesta
Adems de las consideraciones generales sobre
construccin de preguntas, en este tipo de
tems es altamente recomendable evitar
expresiones como TODAS LAS ANTERIORES o
NINGUNA DE LAS ANTERIORES. Si ms de una
opcin es correcta probablemente la pregunta
quede mejor formulada con el formato de
eleccin mltiple con mltiple respuesta.

Eleccin Mltiple con Mltiple


Respuesta
Este tipo de pregunta consta de un enunciado y
cuatro (4) opciones de respuesta identificadas
con los nmeros 1, 2, 3 y 4. Una o varias
opciones
de
estas
pueden
completar
correctamente el enunciado. Este tipo de
pregunta es til para evaluar cualquiera de las
categoras
de
objetivos
educativos.
Sin
embargo, se usa frecuentemente para evaluar
comprensin y aplicacin utilizando: a) una
situacin en la que es necesario considerar
varias consecuencias posibles, b) una situacin
en la que es necesario especificar una o ms
condiciones para definirla adecuadamente, c)
dos situaciones semejantes o dismiles con
respecto a uno o ms puntos de comparacin,

Eleccin Mltiple con Mltiple


Respuesta
Las instrucciones que se dan al examinado son,
generalmente de la siguiente forma:
"A continuacin encontrar preguntas que
constan de un enunciado y cuatro (4) opciones
de respuesta. Una o varias opciones pueden
completar correctamente el enunciado. Usted
debe marcar su hoja de respuestas segn el
cuadro siguiente:
Marque
Marque
Marque
Marque

A
B
C
D

si
si
si
si

las opciones 1, 2 y 3 son correctas


las opciones 1 y 3 son correctas
las opciones 2 y 4 son correctas
slo la opcin 4 es correcta

Eleccin Mltiple con Mltiple


Respuesta
Este tipo de pregunta no debe incluir
distractores mutuamente excluyentes por
cuanto estaran anulando una o varias opciones
de respuesta; tampoco debe incluir en las
opciones de respuesta expresiones como TODAS
LAS
ANTERIORES
o
NINGUNA
DE
LAS
ANTERIORES.

Eleccin Mltiple con Mltiple


Respuesta
Ejemplo:
La investigacin emprica ha encontrado que:
1. Las personas toman menos tiempo en el
aprendizaje de un concepto cuando hay muchos
atributos irrelevantes
2. En el aprendizaje de un concepto son mejores los
ejemplos negativos que los positivos
3. En el aprendizaje de un concepto la velocidad de
aprendizaje es una funcin directa del nmero de
atributos
4. Las personas toman ms tiempo en el aprendizaje
de un concepto cuando hay muchos atributos
relevantes

Informacin Suficiente
Estas preguntas constan de un problema y
dos informaciones identificadas con los
nmeros I y II. No se requiere que el
examinado resuelva el problema, sino que
decida si las informaciones proporcionadas
son necesarias y suficientes para resolverlo.
Este tipo de pregunta es muy til para
evaluar aplicacin.

Informacin Suficiente
Las instrucciones son, generalmente, las siguientes:
"Las preguntas que encontrar a continuacin
constan de un problema y dos informaciones
identificadas con los nmeros I y II. Usted debe
decidir si las informaciones son necesarias y
suficientes para solucionar el problema y marcar su
hoja de respuestas segn el cuadro siguiente: ...
Marque
y II
Marque
Marque
Marque
sirve

A s necesita y basta con las informaciones I


B si necesita y basta con la informacin I
C si necesita y basta con la informacin II
D si cualquiera de las dos informaciones

Informacin Suficiente
Adems de las normas generales, para la
construccin de este tipo de preguntas es
necesario tener en cuenta: a) las informaciones
NO deben ser contradictorias entre s o
mutuamente excluyentes, b) en las preguntas
de clave A, el problema debe poder
solucionarse con las dos informaciones sin
requerir de otra, c) en las preguntas de clave B,
C o D, el problema planteado debe poder
solucionarse con una sola informacin y d) en
las preguntas de clave E las informaciones
deben ser necesarias pero NO suficientes para
resolver el problema.

Informacin Suficiente
Ejemplo 6: Pregunta de Informacin Suficiente
Se quiere comparar el tiempo de reaccin ante
un estmulo en dos poblaciones. Se toman
muestran aleatorias de las poblaciones, se
recogen los datos y se elige un estadstico de
prueba. Para decidir si se acepta o rechaza una
hiptesis de igualdad de medias con un nivel de
significancia , se requiere conocer:
I. la distribucin del estadstico de prueba
II. la probabilidad de obtener un valor mayor
que el observado en el estadstico de prueba

Anlisis de Postulados

Este tipo de pregunta consta de una afirmacin


y dos postulados identificados con los nmeros I
y II. Entre la afirmacin y los postulados se
encuentra la palabra POR CONSIGUIENTE. Para
responder este tipo de pregunta el examinado
no necesita evaluar el valor de verdad de las
afirmaciones, todo se supone verdadero; solo
debe analizar la relacin lgica existente entre
afirmacin y postulados. Es un tipo de pregunta
de difcil elaboracin y requiere de cuidadoso
anlisis previo para que la respuesta sea
inequvoca. Es muy adecuado para evaluar
anlisis.

Anlisis de Postulados
Las instrucciones para responder este tipo de
pregunta son, generalmente, como se muestra a
continuacin
"Las preguntas que encontrar a continuacin
constan de una afirmacin VERDADERA y dos
postulados tambin VERDADEROS identificados con
los nmeros I y II. Usted debe decidir si los postula
dos se deducen lgicamente de la afirmacin y
contestar segn el cuadro siguiente: ...
Marque
II
Marque
Marque
Marque
la tesis

A s de la tesis se deducen los postulados I y


B si de la tesis solo se deduce el postulado I
C si de la tesis solo se deduce el postulado II
D si ninguno de los postulados se deduce de

Anlisis de Postulados
Ejemplo 7: Pregunta de Anlisis de
Postulados
Es inimputable quien comete el delito bajo
influencia determinante de un trastorno
mental
POR CONSIGUIENTE
I. Un psictico puede ser inimputable
II. Un inimputable comete un hecho tpico
y antijurdico pero no culpable ni punible

Anlisis de Postulados

Adems de las normas generales, para la construccin


de este tipo de preguntas es necesario tener en
cuenta: a) aun cuando la instruccin le indica al
examinado que debe suponer todo verdadero, es
recomendable que las afirmaciones lo sean en efecto
o, por lo menos que no sean absurdos u obviamente
falsos, b) todas las afirmaciones deben ser
gramaticalmente completas e independientes unas de
otras, c) la construccin de la pregunta debe ser tal
que la deduccin lgica sea indiscutible, de manera
que la respuesta correcta sea inequvoca y d) este tipo
de pregunta es til para poblaciones de alto nivel
educativo.

Anlisis de Relaciones

Las preguntas de este tipo presentan dos


afirmaciones unidas por la palabra PORQUE y la
segunda afirmacin se considera una RAZON
verdadera o supuesta de la primera. El examinado
debe evaluar tanto el valor de verdad de las
afirmaciones como la relacin entre ellas. A
diferencia de las preguntas de anlisis de
postulados, en stas las afirmaciones pueden ser
verdaderas o falsas. Este tipo de preguntas es
particularmente til para evaluar anlisis y presenta
menos dificultades prcticas que la pregunta de
anlisis de postulados.

Anlisis de Relaciones
Las preguntas que encontrar a continuacin constan
de una afirmacin y una razn unidas por la palabra
PORQUE. Usted debe juzgar tanto el grado de verdad o
falsedad de cada una de ellas como la relacin existente
entre las mismas, y contestar en su hoja de respuestas
segn el cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la
segunda es una razn o explicacin correcta de la
primera
Marque B si ambas afirmaciones son verdaderas pero
la segunda NO es una razn o explicacin correcta de la
primera
Marque C si la primera afirmacin es verdadera pero la
segunda es falsa
Marque D si la primera afirmacin es falsa pero la
segunda es verdadera
Marque E si ambas afirmaciones son falsas

Anlisis de Relaciones
Las preguntas que encontrar a continuacin
constan de una afirmacin y una razn unidas por la
palabra PORQUE. Usted debe juzgar tanto el grado
de verdad o falsedad de cada una de ellas como la
relacin existente entre las mismas, y contestar en
su hoja de respuestas segn el cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la
segunda es una razn o explicacin correcta de la
primera
Marque B si ambas afirmaciones son verdaderas
pero la segunda NO es una razn o explicacin
correcta de la primera
Marque C si la primera afirmacin es verdadera
pero la segunda es falsa
Marque D si la primera afirmacin es falsa pero la
segunda es verdadera
Marque E si ambas afirmaciones son falsas

Anlisis de Relaciones

Para la construccin de este tipo de


preguntas es necesario tener en cuenta: a)
las afirmaciones no deben ser obviamente
falsas u obviamente verdaderas, b) las
afirmaciones no deben ser contradictorias
entre s o mutuamente excluyentes y c) las
afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o
falsedad independientemente, es decir,
deben
ser
frases
gramaticalmente
completas.

Anlisis de Relaciones

Para la construccin de este tipo de


preguntas es necesario tener en cuenta: a)
las afirmaciones no deben ser obviamente
falsas u obviamente verdaderas, b) las
afirmaciones no deben ser contradictorias
entre s o mutuamente excluyentes y c) las
afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o
falsedad independientemente, es decir,
deben
ser
frases
gramaticalmente
completas.

Anlisis de Relaciones
Ejemplo 8: Pregunta de Anlisis de Relaciones
El hemisferio cerebral izquierdo regula las
contracciones musculares del lado derecho
del cuerpo
PORQUE
las fibras motoras y sensitivas se cruzan en
el bulbo

ANLISIS DE LOS TEMS

Estimacin de la Dificultad del tems


xito en la estimacin en contextos variados

Propiedades del sujeto


tems

Halo
Juicios Subjetivos
Calificacin
Administracin
Rapport

Propiedades de los

Azar
Covarianza con la prueba
(Homogeneidad)
Frecuencia de cada opcin
Dificultad
Discriminacin
Correlacin con la prueba

INDICE DE DIFICULTAD

Indica la proporcin de aciertos en la muestra de


alumnos que estamos utilizando. Es la media de
ste 50% de sujetos analizados.

El trmino de dificultad se presta a equvocos: in


ndice mayor indica un pregunta mas fcil.

Este ndice de dificultad sirve para evaluar


cuatro variables:
La complejidad de la habilidad medida.
Las caractersticas del logro del grupo.
La comparacin de distintos reactivos que miden
la misma habilidad.
La comparacin de reactivos que miden la
misma habilidad pero con una relacin
jerrquica.

1.
2.
3.
4.

INDICE DE DIFICULTAD
Se fija un mnimo valor aceptable de p = 0.5 para
considerar el reactivo bueno, cualquier medida
inferior a 0.5, aunque no quiere decir que el reactivo
no sirve, es mejor no usarlo porque podra ser que lo
que est mal son las instrucciones.

Criterios para calificar la dificultad de los reactivos


de acuerdo al valor del ndice de dificultad de los
reactivos p.

Muy difcil
fcil
0% - 49%

Optima
50% - 69%

Ligeramente fcil
70% - 89%

Muy

90% - 100%

INDICES DE DISCRIMINACION

Los ndices de discriminacin expresan en que


medida cada pregunta o tem diferencia a los
que mas saben de los que menos saben.

Es el ndice probablemente ms utilizado.


Expresa hasta que punto la pregunta
discrimina, establece diferencias, contribuye a
situar a un sujeto en el grupo superior e
inferior.

A mayor diferencia, en numero de acertantes


entre los grupos superior e inferior, el tem es
mas discriminante, contribuye mas a situar a
un sujeto entre los primeros o entre los
ltimos.

Las preguntas muy fciles y muy difciles


no discriminan, no establecen diferencias;
nos dicen que todos saben o no saben una
pregunta, pero no quien sabe mas y quien
menos. Estas preguntas no contribuyen a
la fiabilidad del test, pero eso no quiere
decir necesariamente que sean malas
preguntas.

Si todos y solos los del grupo superior


responden correctamente, tendremos que:
ID=1.

Si todos y solos los del grupo inferior


responden correctamente, tendremos que:
ID= -1.

Si el ID es menor de 0.30 el tem


debe
eliminarse
porque
no
discrimina, an cuando su nivel de
dificultad sea ptimo.

Si el tem tiene un ID igual o superior


a 0.30 y su nivel de dificultad no es
ptimo debe entonces corregirse y
mejorarse ya que discrimina y puede
considerarse como un tem adecuado
para la prueba.
A mayor valor,
mayor poder discriminativo.

Forma de calcular D y P

1.
2.

Procedimiento:
Hallar los puntajes totales por sujeto.
Ordenarlos de mayor a menor o al revs.
Nos interesan los puntajes extremos
(27% de bajos) y (27% de altos) y los
puntajes promedio no sirven para el
anlisis, se ocultan. Por ejemplo, si hay
100 datos el 27% serian 27 datos y si
fueran 70 datos el 27% seria equivalente
a 18 datos.

3.

4.

Calcular el nmero de sujetos del grupo


de los altos que responde correctamente
bien cada tem y calcular el nmero de
sujetos del grupo de los bajos que
responde bien cada tem.
Identificar el ndice de dificultad por la
formula:
P = nG(altos)A + nG(bajos)B
G(total)A + G(total)B
y el ndice de dificultad con la formula:
D = GA + GB
G(total).

Potrebbero piacerti anche