Lectura Fundamental 6 Psicometria PDF

Unidad 3
1 //Escenario
Escenario26
Lectura fundamental
Fundamental
Construcción
Etapas de un plan
y diseño
de comunicación
de un test:
reactivos,
estratégicaformatos y normas de
puntuación
Contenido
1 Construcción y diseño del test
2 Formatos de reactivos y opciones de respuesta
3 Normas de puntuaciones
Palabras clave: reactivos, ítems, construcción, diseño, test.

Hasta este punto se ha conocido la emergencia y el desarrollo de la psicométrica como ciencia y rama de
la psicología. Se expuso la fundamentación teórica producto del trabajo en esta disciplina que ha permitido
el avance de la medición de los asuntos psicológicos, desde distintos tipos de pruebas. En esta tercera
Unidad, el objetivo ha sido conocer las bases sobre las cuales reposa la construcción de un test válido y
confiable, que favorezca la elección y el diseño adecuado de una prueba. Sin embargo, todo psicólogo, en
cualquier área donde ejerza como profesional, tendrá la necesidad de construir o adaptar un instrumento
que le permita conocer el estado de las cosas con las que trabaja, bien sea porque no cuenta con el acceso
a pruebas validadas en ese campo, porque el atributo que pretende medir es específico y particular o por el
tipo de población. Lo anterior exige un ajuste teórico que le asegure que tendrá un buen instrumento.
En esta Lectura fundamental, usted conoce cómo se estructura una prueba cuya base son los ítems y sus
opciones de respuesta.
1. Construcción y diseño del test

Esta labor comienza con la identificación de la necesidad de evaluar o medir algún atributo de interés
con un objetivo claro, que puede ir desde seleccionar un candidato o determinar el desempeño,
hasta simplemente conocer el estado del atributo con fines investigativos. Un primer paso ineludible
consiste en verificar si existe al alcance una prueba estandarizada, pues ello ahorra trabajo y asegura
ciertas condiciones estables y confiables con las cuales se pueda cumplir el objetivo; acá, el trabajo
del psicólogo consiste en saber elegir la prueba adecuada. No obstante, para los casos en los que
no es posible tener a mano una prueba estandarizada, es importante tener en cuenta una serie de
elementos o criterios generales que favorecen la construcción y el diseño de una prueba.
1.1. Criterios generales para la construcción de una prueba
De forma básica se puede decir que una prueba debe tener en cuenta como mínimo la elección del
contenido, su expresión en forma de reactivos o ítems y unas opciones de respuesta. Esto no quiere
decir que sea lo único a considerar, pues cada uno de estos mínimos tiene dentro de sí una serie de
aspectos que Moreno, Martínez y Muñiz (2004) consideran cruciales para construir buenos ítems
con opciones de respuesta múltiple que compongan una prueba de desempeño o ejecución máxima.
Estos aspectos se presentan a continuación.
POLITÉCNICO GRANCOLOMBIANO 2
1. Para la elección del contenido que se quiere evaluar:
a. Se debe asegurar que sea una muestra representativa del contenido que ha sido previamente
especificado o clasificado, evitando con ello ubicar información en los ítems insignificantes.
b. La muestra seleccionada debe reflejar lo sencillo o complejo, lo concreto o abstracto, lo

memorístico o de razonamiento y su forma de expresarlo.
2. Para la expresión del contenido en el ítem:
a. El enunciado debe expresar lo central del contenido. Cada opción de respuesta es un

complemento que debe concordar con el enunciado.
b. Debe ser gramaticalmente correcto. La escritura del ítem debe evitar ser demasiado sencilla
o compleja, ambigua o confusa, evitando las expresiones negativas.
c. La semántica o significado del ítem debe ajustarse al contenido y a las personas evaluadas.
3. Para la construcción de las opciones de respuesta:
a. La opción correcta debe ser una sola, acompañada de distractores útiles.
b. La opción correcta debe estar repartida entre las distintas opciones.
c. Preferiblemente deben ubicarse tres opciones.
d. La ubicación más adecuada para cada opción es la vertical o una sobre la otra.
e. Las opciones de respuesta deben aparecer en conjunto.
f. Las opciones de respuesta deben ser autónomas entre sí, es decir, una opción no debe
hacer referencia a otra, ni repetirse. Se debe evitar usar las opciones “todas las anteriores” y
“ninguna de las anteriores”.
g. Ningunas de las opciones de respuesta debe destacar en contenido o apariencia.
Así, para elaborar una prueba es necesario, según Thomas (2015), seguir estos pasos.
1. Definir el propósito de la prueba. Este paso incluye una descripción detallada del atributo o
rasgo a medir, así como la información sobre el público al que se dirigirá. Al formular el objetivo
se debe pensar en la forma en la que se interpretarán los resultados, así como su modo de
aplicación, la extensión y formato de los reactivos, el número de puntuaciones y su informe.
2. Diseño de la prueba. En este apartado se concreta la estructura que tendrá la prueba, la cual se
detalla a continuación.
Modo de aplicación
Individual Grupal
Extensión
Tiempo: corta (15 min.) o larga (45 min.) Número de reactivos
Formato de reactivos
Abierto Cerrados
Número de puntuaciones
Se relaciona con la extensión de la prueba.
Informes de puntuación
Forma en la que se mostrarán los resultados. Una por el total de la prueba o por dimensiones.
Capacitación para la aplicación

Qué tanta capacitación profesional será necesaria para aplicar, calificar e interpretar la prueba
Investigación de los antecedentes

Búsqueda de literatura pertinente al tema y discusion con profesionales
de los campos donde se usará la prueba.
Figura 1. Elementos estructurales de una prueba

Fuente: elaboración propia, basada en Thomas (2015)
3. Preparación de reactivos. Una vez se tiene claro el propósito de la prueba y se han concretado los
preliminares del diseño, es posible comenzar el trabajo sobre los reactivos. Un reactivo tiene cuatro
partes: la primera es el tronco, que corresponde al estímulo y que puede ser una pregunta, una
afirmación, un enunciado o una imagen que incluye la instrucción. La segunda es el formato de
respuesta en el que se estructura la forma en la que se presentan las opciones de respuesta, sean
abiertas o cerradas, de opción múltiple o dicotómica. La tercera son las condiciones que regulan
la forma en que se emiten las respuestas, como el tiempo para responder o en el que se registra la
respuesta. Finalmente, la cuarta parte es el procedimiento de calificación o las rúbricas que especifican
la forma como se evaluará el desempeño, que incluye identificar las respuestas correctas e incorrectas
y las puntuaciones diferenciadas para las distintas elecciones por parte del sujeto (Thomas, 2015).
Los pasos restantes para la construcción de un test psicométrico como el tipo de reactivos, su análisis
y estandarización se tratan al detalle en los apartados que se presentan a continuación. El apartado de
preparación de materiales finales y publicación consiste en alistar el material de la prueba, siguiendo las
partes básicas de una prueba, revisadas en la unidad 1.
1.2. Calificación de un test
Para calificar ítems de formato abierto es posible usar dos métodos, según Thomas (2015):
1. Evaluación interjueces. En este método, se apela al juicio de, por lo menos, dos jueces que
evalúan la pertinencia de la respuesta respecto de unos criterios definidos con antelación.
2. Conceptualización de un esquema de calificación. Este método usa cuatro formas: la holística,

que otorga puntuaciones sobre la valoración general del desempeño mostrado; la analítica, que
valora el desempeño por dimensiones y de forma más detallada; por puntos, donde se califican
los criterios de la ejecución y por cada uno se otorga un punto; y por último está la calificación
automatizada, que se vale de programas de cómputo para identificar los aciertos en la prueba.
En el caso de las pruebas de reactivos cerrados o las pruebas de ejecución máxima, la calificación puede
identificar las respuestas correctas e incorrectas. En este caso la puntuación total sería la suma de las
respuestas correctas, pues se concede un punto a las correctas y cero a las incorrectas. Sin embargo,
existe la opción de puntuar distinto cada opción seleccionada; por ejemplo, dando un punto a la opción
A por ser la más pertinente, 0,5 para la B por ser adecuada y 0 para la C por ser incorrecta.
En el caso de las pruebas de formato cerrado de elección típica, como las pruebas de actitud,
personalidad e intereses, se suele usar el 1 y 0 para indicar niveles o presencia y ausencia del
atributo. Por ejemplo, se usa 1 cuando el ítem que evalúa estrés indica más ansioso. Para ítems de
opción múltiple, es posible asignar calificación de 3, 2 y 1 o +1, 0 y -1. En las escalas tipo Likert es
posible asignar puntos de 5, 4, 3, 2 y 1 o +2, +1 0 -2, -1, pero también es viable otorgar 1 punto a las
respuestas totalmente de acuerdo y de acuerdo, y 0 a las demás (Thomas, 2015).
1.3. Análisis de reactivos
El análisis de ítems o reactivos se realiza a partir de dos modelos: la teoría clásica de test (TCT) y la teoría
de respuesta al ítem (TRI). La TCT expresa que la puntuación obtenida por una persona al contestar un
ítem está compuesta por una parte del nivel verdadero de esa persona y una parte de error. Esta teoría
busca medir y minimizar el nivel de error, analizando la confiabilidad de esa medida (Meneses, 2013).
Bajo estos principios, según Meneses (2013), la TCT establece que las principales propiedades a
medir en un ítem que integra una prueba de desempeño son:
1. Dificultad: bajo el índice de dificultad se identifica la proporción de personas que lo contestan

correctamente. La fórmula se expresa así: el índice de dificultad es igual al número de personas que
aciertan el ítem sobre el número de personas que lo contestan. La interpretación sigue la lógica
que indica que entre más cercano esté a 1, existe baja dificultad; mientras que la cercanía a 0 indica
dificultad máxima. Este índice desconoce los aciertos al azar, por lo que un factor para tener en cuenta
es la cantidad de opciones de respuesta, que representa la probabilidad de responder acertadamente.
2. Discriminación: indica la capacidad de un ítem para distinguir entre las personas que tienen
buen rendimiento o alto puntaje frente a las que no lo tienen. A la forma de saber si un reactivo
es acertado por quienes suelen tener altas o bajas puntuaciones se le denomina índice D o
índice basado en las proporciones de aciertos. Este se obtiene después de haber aplicado el
test, cuando se cuenta con el porcentaje de las puntuaciones superiores, aquellos que obtienen
puntajes superiores al 75%, y el de las inferiores, aquellos que tienen puntuaciones bajo el 25%.
Con estos datos, se resta la proporción del alto rendimiento a la proporción de bajo rendimiento.
Cuando el resultado de D es positivo, el ítem está discriminando, no obstante, el resultado se
interpreta así: ≥40, alta discriminación; (b) entre 30 y 40, aceptable; (c) entre 20 y 30 es baja
y se sugiere revisar el ítem; (d) entre 10 y 20 es baja y se debe eliminar el ítem o reformarlo
profundamente; y (e) ≤20 es inaceptable, se debe eliminar el ítem.
3. Discriminación de los distractores: ayuda a saber si los distractores que acompañan la respuesta
correcta están cumpliendo su función. Se calcula usando el índice D, pero en lugar de hacerlo
con quienes aciertan y fallan, se hace con la proporción de los que eligen cada una de las opciones
de respuesta. Este índice se interpreta igual: si el resultado es positivo está discriminando o
distrayendo, es decir, las personas lo eligen. Hay que aclarar que para que se pueda aplicar este
índice, todas las opciones de respuesta deben ser coherentes con el enunciado.
4. Valoración del sesgo: al sesgo se le denomina falta de equidad. Dentro del trabajo psicométrico,
es una necesidad tratar a todos los participantes imparcialmente, sin importar características
personales como etnia, género o condición de discapacidad, haciéndolas irrelevantes para el
test, es decir, que no tengan incidencia en los resultados y su interpretación. Así pues, un test
puede ser sesgado en su elaboración cuando no se tiene en cuenta la validez del constructo, al
introducir componentes irrelevantes que pueden llevar a que algunas personas que pertenecen a
ciertos subgrupos obtengan puntuaciones más bajas que el resto. También puede ser sesgado en
su uso, pues las puntuaciones bajas de cierta población pueden interpretarse como que derivan
de su condición y no de las propiedades de la prueba (Martínez y Hernández, 2014). Esta es
considerada una fuente de error sistemático, pues introduce distorsión en los resultados de
un test para los miembros de un grupo particular (Martínez y Hernández, 2014). Por ejemplo,
cuando Alfred Binet elaboró en 1910 su test de inteligencia, notó que en algunos ítems los niños
de estratos socioeconómicos más bajos rendían peor. Al ver esto, pensó que estos ítems podrían
estar midiendo los efectos del entrenamiento cultural en lugar de la verdadera capacidad mental
de los niños. El objetivo es crear test libres de efectos culturales.
El índice que evalúa el sesgo es también llamado índice de funcionamiento diferencial de los ítems (DIF)
e identifica si estadísticamente se presenta una diferencia significativa en las puntuaciones de dos grupos
que, a juicio lógico, se espera tengan el mismo desempeño, por ejemplo, entre hombres y mujeres.
Este se calcula dividiendo a los sujetos en dos grupos en función de sus puntuaciones totales, luego se
elabora una tabla por grupos en la que se pueda observar si la variable cultural interviniente, por ejemplo,
el género se asocia con acertar más. Dicho resultado se analiza con el estadístico Mantel-Haenszel y se
compara con el grupo de referencia; si el resultado es significativo (0.05), la prueba tiene sesgo.
¿Sabía que...?
El índice de significancia es un umbral que permite determinar si el resultado
de un estudio es estadísticamente significativo como para ratificar una
hipótesis. Por ejemplo, la hipótesis afirma que el test contiene ítems que
sesgan los resultados a favor de los hombres. Si el resultado estadístico es
igual o menor a 0.05, se considera que la prueba contiene ítems sesgados.
Bajo la teoría de respuesta al ítem, el cálculo o análisis se hace sobre cada ítem cuyo objetivo es medir el rasgo
latente desde tres parámetros: discriminación del ítem, dificultad y acierto al azar. El cálculo se hace a partir
de la curva característica del ítem (CCI), que en el plano Y ubica la probabilidad de acertar el ítem a partir de
la magnitud del rasgo latente o constructo que se mide; y en el eje X la dificultad a partir de la probabilidad de
acierto, que es del 50 %. La interpretación se hace sobre el nivel de rasgo latente necesario para obtener un
50 % de probabilidades de acertar el ítem bajo el nivel de discriminación, de dificultad y de azar (Meneses,
2013). La limitación de esta forma de análisis de ítems es que requiere un software muy específico.
2. Formatos de reactivos y opciones de respuesta

La redacción de un ítem depende de la forma en la que va a ser respondido, del tiempo en el que se
espera sea respondido y del uso y la forma en la que se califica. Las dos formas básicas son los ítems
abiertos y los cerrados.
2.1. Abiertos
Son formatos que exigen que la persona construya la respuesta, por ejemplo:
También están aquellos en los que la persona debe completar frases añadiendo uno o más elementos
de una oración, por ejemplo:
La ____________, sostenida y selectiva son tipos de ______________.
Existen test de ejecución típica con ítems sencillos de respuesta abierta, en los que la persona debe
completar la frase o asociar palabras.
Asociación de palabras: Por favor diga la primera palabra que venga a su mente
cuando yo le diga la palabra.
Frío.
Universidad.
Invierno.
Padre.
2.2. Cerrados
Los ítems con formato cerrado brindan al evaluado las diversas opciones de respuesta indicando que
se seleccione la opción u opciones que considera correctas. Este tipo de formato suele ser útil para
evaluar poblaciones grandes, tareas cognitivamente complejas y procesos (Haladyna, 1994). Los
formatos cerrados más comunes se muestran ejemplificados en la Tabla 1.
Tabla 1. Formatos de reactivo según el tipo de opción de respuesta
Formato Ejemplo
Un tipo de atención es:
1. Atenta
Selección múltiple usual
2. Distraída
3. Selectiva
Una teoría que permite elaborar ítems adecuados es:
Selección alternativa 1. Teoría clásica del ítem
2. Teoría de respuesta al ítem
Formato Ejemplo
La atención selectiva hace referencia al tiempo que una persona es capaz de

concentrarse en un estímulo simple.
Verdadero-falso
1. Falso
2. Verdadero
Señale si es verdadero (V) o falso (F) que las siguientes son características de
un estadístico descriptivo.
Verdadero falso múltiple 1. Organizan la información

2. Describen cualitativamente
3. Interpreta los datos
Conecte los siguientes departamentos con sus capitales:

1. Magdalena a. Leticia
Emparejamiento
2. Amazonas b. Santa Marta
3. Bolívar c. Cartagena
Son municipios del departamento de Cundinamarca

a. Girardot
b. Fusagasugá
c. Ventaquemada
Elección múltiple complejo
1. a y b
2. b y c
3. a, b y c
En una oficina donde se comparte un mismo espacio, se han generado
conflictos por el tono de voz usado por parte de algunos trabajadores, y el gusto
de algunos por escuchar música a un alto volumen.
¿Cuál sería el camino para resolver esta situación, considerando que se debe
procurar que todos los involucrados se sientan satisfechos?
Conjunto de ítems dependientes de
un contexto a. Obedeciendo lo que indica el jefe que se haga.
b. Consensuando pautas de comportamiento en el trabajo.
c. Imponiendo el punto de vista del que es más popular.
d. Esperando que la situación se resuelva con el paso del tiempo
Fuente: elaboración propia, basada en Moreno, Martínez y Muñiz (2004)
Para pruebas de ejecución típica o de rasgo, que son pruebas que miden aspectos no escalables,
donde no hay respuestas correctas o incorrectas, los formatos varían sustancialmente en las opciones
de respuesta. Los más comunes son las escalas tipo Likert, donde se usa una escala de cinco puntos
que va desde completamente de acuerdo hasta completamente en desacuerdo o las escalas de
valoración gráfica. A continuación, se presentan un par de ejemplos.
Ejemplo escala Likert

Marque con una (X) la opción que más se ajuste a su condición personal.
5 (Completamente de acuerdo) 4 (De acuerdo) 3 (Indeciso)
2 (En desacuerdo) 1 (Completamente en desacuerdo)
1 2 3 4 5
Me encanta la matemática
Las fórmulas matemáticas son geniales
Mi clase favorita es estadística
Me divierten los problemas matemáticos
Me gusta aprender matemáticas
Ejemplo escala de valoración gráfica
Marque cualquier punto de la línea para mostrar su nivel de motivación
Muy motivado _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Nada motivado
_ _ _ / _ _ _ /_ _ _ /_ _ _/_ _ _/ _ _ _/ _ _ _/ _ _ _ / _ _ _ / _ _ _
1 2 3 4 5 6 7 8 9 10
Escala para convertir las marcas a escala numérica
Figura 2. Ejemplos de los tipos de formatos para reactivos en pruebas de ejecución típica
Fuente: elaboración propia, basada en Thomas (2015)
3. Normas de puntuaciones
Al crear una prueba o seleccionarla, se debe tener en cuenta el tipo de puntuaciones sobre las cuales se
realiza la interpretación. Una verdadera prueba psicométrica tiene en cuenta estos tipos de puntuaciones,
que varían según la base teórica sobre la cual se crea. Los test referidos a norma (TRN) proporcionan
puntuaciones derivadas como las típicas o z, decatipos, eneatipos, percentiles, puntuaciones T o edades
escalares, que son a las que se pasan las puntuaciones directas, crudas o brutas (puntajes que la persona
registra cuando responde la prueba). En los test referidos a criterio (TRC), se trabaja únicamente con las
puntuaciones directas, crudas o brutas, que en ocasiones se pasan a porcentajes y no más (Aragón, 2015).
En las pruebas elaboradas sobre puntuaciones normalizadas o TRN, existen, según Aragón (2015), tres conceptos
clave que tienen que ver con las puntuaciones derivadas: normalización, estandarización y baremación.
3.1. Normalización
Las puntuaciones se normalizan cuando, al aplicar la prueba a una muestra representativa de la

población objetivo, que se convertirá en el grupo normativo de referencia, la distribución de esos
datos o puntuaciones sigue una curva normal.
Tabla 2. Normalizar la puntuación
Puntuación Descripción Ejemplo

Percentiles Percentil 60 indica que la persona obtuvo una
Indican el porcentaje del grupo que se deja
puntuación superior al 60% respecto de su grupo de
o centiles por debajo.
referencia.
Z=2 indica que la persona está dos desviaciones por
fuera de la media, mostrando un desempeño alto
Indica cuánto se separa la puntuación del frente a su grupo de referencia.
Puntuación típica
sujeto respecto de la media que se representa
oz Z=-2 Indica que la persona está dos desviaciones por
con 0. La desviación va de 1+ y - a 3 + y -.
fuera de la media, mostrando un desempeño bajo
frente a su grupo de referencia.
Un niño de 8 años obtiene en el test un CI
Indica la posición del sujeto en función de (coeficiente intelectual) de 86. Esto indica que la
Edad cronológica su edad. Es usada en las pruebas de edad ejecución lo ubica por debajo de la norma en cuanto
mental y CI. a inteligencia, mostrando un desempeño de un niño
de 6 años, con un atraso de inteligencia de 2 años.
Distribuye las puntuaciones en una curva

normal, dividiéndola en una escala de 10 El decatipo 8 indica que la persona está un
Decatipos o
puntos. Los 4 decatipos centrales (4 al 7) decatipo por encima de la norma, mostrando un
eneatipos
representan la normalidad, los demás, los desempeño superior al grupo de referencia.
casos atípicos (1 a 3 y 8 a 10).
Fuente: elaboración propia, basada en Aragón (2015)
3.2. Estandarización
En este tipo de puntuación, se debe aplicar la prueba a una muestra representativa, producto de
aleatorización para su conformación, velando porque en esta muestra se encuentre representación
de cada grupo que conforma la población (Aragón, 2015). Estas condiciones hacen de este proceso
el más costoso, pues necesita una cantidad grande de personas, para que los resultados permitan
conocer el comportamiento de la prueba en una población particular.
Si, por ejemplo, se quiere estandarizar una prueba en población colombiana, lo primero es saber
el total de la población del país y luego en las regiones, para saber cuántas personas deben estar
presentes por cada región. Con este número, las personas que integran cada grupo deben ser elegidas
aleatoriamente, es decir, cada habitante de la región debe tener la misma probabilidad de ser elegida.
3.3. Baremación
Este es un proceso que busca obtener las puntuaciones normalizadas con una muestra lo más
representativa posible de la población. Se usa cuando se quiere verificar qué tan confiable sería una
prueba elaborada o con baremos de otro país o región, en donde se quiere aplicar. Por ejemplo, una
prueba con baremos de población mexicana que se quiere usar para población colombiana. Todo inicia
con una muestra representativa, luego se eligen personas que cumplan características en términos
de edad o características que la prueba exprese, para después elegir al azar a quienes se les aplicará
la prueba. Las puntuaciones directas obtenidas de esta aplicación se transforman en puntuaciones
derivadas. Si estas toman forma de curva normal, las puntuaciones serán típicas o z, pero si toman
forma aplanada o planocúrtica, las puntuaciones serán decatipos o eneatipos. Si no se da ninguna de
estas dos formas, se usarán las puntuaciones percentiles (Aragón, 2015).
¿Sabía que...?
Un baremo es un conjunto de normas que se establecen en forma

de convención para representar el criterio sobre el cual se realiza la
comparación de las puntuaciones directas obtenidas por las personas.
Referencias
Aragón, B. L. (2015). Evaluación psicológica: historia fundamentos teórico-conceptuales y psicometría
(2a. ed.). México, D.F.: Manual Moderno.
Haladyna, T. M. (1994). Developing and validating multiple-choice test items. Hillsdale, New Jork: LEA.
Martínez, A. M. y Hernández, L. M. (2014). Psicometría. Madrid: Difusora Larousse-Alianza Editorial.
Meneses, J. (2013). Psicometría. Barcelona: Editorial UOC.
Moreno, R., Martínez, R. y Muñiz, J. (2004). Directrices para la construcción e ítems de elección múltiple.
Psicothema, 16 (3), 490-497.
Thomas, P. H. (2015). Pruebas psicológicas: una introducción práctica (Segunda edición). Distrito Federal:
Manual Moderno.
INFORMACIÓN TÉCNICA
Módulo: Psicometría
Unidad 3: Elaboración de instrumentos de medición
Escenario 6: Construcción y diseño de un test: reactivos,
formatos y normas de puntuación
Autor: Yury Estefanía Perdomo
Asesor Pedagógico: Óscar Salazar

Diseñador Gráfico: Walter Rodríguez B.
Asistente: Alejandra Morales
Este material pertenece al Politécnico Grancolombiano.

Prohibida su reproducción total o parcial.

Lectura Fundamental 6 Psicometria PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Lectura Fundamental 6 Psicometria PDF

Caricato da

Copyright:

Formati disponibili

Unidad 3

1 Construcción y diseño del test

2 Formatos de reactivos y opciones de respuesta

Palabras clave: reactivos, ítems, construcción, diseño, test.

1. Construcción y diseño del test

1.1. Criterios generales para la construcción de una prueba

b. La muestra seleccionada debe reflejar lo sencillo o complejo, lo concreto o abstracto, lo

2. Para la expresión del contenido en el ítem:

a. El enunciado debe expresar lo central del contenido. Cada opción de respuesta es un

3. Para la construcción de las opciones de respuesta:

a. La opción correcta debe ser una sola, acompañada de distractores útiles.

b. La opción correcta debe estar repartida entre las distintas opciones.

c. Preferiblemente deben ubicarse tres opciones.

e. Las opciones de respuesta deben aparecer en conjunto.

g. Ningunas de las opciones de respuesta debe destacar en contenido o apariencia.

Capacitación para la aplicación

Investigación de los antecedentes

Figura 1. Elementos estructurales de una prueba

1.2. Calificación de un test

2. Conceptualización de un esquema de calificación. Este método usa cuatro formas: la holística,

1.3. Análisis de reactivos

1. Dificultad: bajo el índice de dificultad se identifica la proporción de personas que lo contestan

2. Formatos de reactivos y opciones de respuesta

La ____________, sostenida y selectiva son tipos de ______________.

La atención selectiva hace referencia al tiempo que una persona es capaz de

Verdadero falso múltiple 1. Organizan la información

Conecte los siguientes departamentos con sus capitales:

Son municipios del departamento de Cundinamarca

Fuente: elaboración propia, basada en Moreno, Martínez y Muñiz (2004)

Ejemplo escala Likert

Las fórmulas matemáticas son geniales

Mi clase favorita es estadística

Me divierten los problemas matemáticos

Me gusta aprender matemáticas

Las puntuaciones se normalizan cuando, al aplicar la prueba a una muestra representativa de la

Puntuación Descripción Ejemplo

Distribuye las puntuaciones en una curva

Fuente: elaboración propia, basada en Aragón (2015)

Un baremo es un conjunto de normas que se establecen en forma

Martínez, A. M. y Hernández, L. M. (2014). Psicometría. Madrid: Difusora Larousse-Alianza Editorial.

Meneses, J. (2013). Psicometría. Barcelona: Editorial UOC.

Autor: Yury Estefanía Perdomo

Asesor Pedagógico: Óscar Salazar

Este material pertenece al Politécnico Grancolombiano.

Potrebbero piacerti anche

La , sostenida y selectiva son tipos de __.