Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CARRERA PSICOLOGIA
Asignatura : PSICOMETRIA i
SEMESTRE :3
periodo : i-2020
HUANCAYO, 2011
CAPACIDADES
ACTIVIDAD nº 01
PSICOMETRIA
rapidez con que reaccionaban ante un estímulo visual (lo llamo ecuación personal), este
suceso tuvo gran relevancia para la psicología ya que sentó las bases para la medición
de al menos una característica mental (Tyler, 1978)
En la actualidad, la construcción de escalas y el análisis de datos obtenidos, perderían su
carácter de objetividad sin el uso de los métodos estadísticos (medidas de tendencia
central). La estadística permite determinar aproximaciones correlaciónales entre
variables. En la determinación de correlaciones entre dos variables, el análisis estadístico
es muy útil para condensar y analizar los datos.
La estadística es la disciplina que proporciona una metodología para recoger, organizar,
resumir, analizar datos y hacer inferencias a partir de ellas. La Estadística se divide en:
estadística descriptiva y estadística Inferencia. En la estadística descriptiva, se analizan
indicadores como: los porcentajes, la media, la moda, la mediana, la desviación típica, los
percentiles, etc. En el caso de la estadística inferencial, que es en la que se apoya la
psicología para hacer inferencias, los tópicos a analizar son las leyes del azar y el
concepto de probabilidad, los tipos de muestreo, diferencia de medias y análisis de
varianza.
La medición y las teorías psicológicas: Existen diversas teorías que tratan sobre la
razón por la cual las personas se comportan como lo hacer. Algunos teóricos centran el
énfasis en la herencia y el ambiente como modeladores del comportamiento humano. Las
teorías de los tipos, de los rasgos, psicoanalíticas, fenomenológicas, son útiles como guía
hacia la medición y comprensión de la personalidad.
Tipos de escalas: Son cuatro las escalas utilizadas para medir variables físicas y
psicológicas. Si se utilizan números para describir o nombrar algo la escala debe ser
nominal. En una escala ordinal los números se refieren a la clasificación ordenada de
objetos o eventos en función del rasgo que se mide. En las escalas de intervalo la
distancia entre intervalos tendrá que establecer valores iguales. Este tipo de escalas son
las más usadas para medir variables psicológicas y comparar diferencias interindividuales
o intraindividuales.
Las escalas de razón son las que poseen un cero real que significa ausencia total de lo
que se quiere medir (Coolican, 1997).
Por lo regular existen diferentes métodos de medición escalar, los cuales pueden estar
abocados a medir personas, estímulos y tipos de respuesta. La medición escalar de
estímulos se puede realizar con base a estimaciones subjetivas, ya que se requiere la
tarea evaluativo del sujeto. Los modelos discriminativos son otra opción, estos modelos
ponen énfasis en la variabilidad de la respuesta a cada estímulo.
Definición y función de las pruebas: (tests): Una prueba psicológica es una medida
objetiva y tipificada de una muestra de conducta. “Una prueba psicológica sirve de
estímulo para extraer un segmento de la conducta. Es rigurosamente estandarizada, o
sea se construye, se administra y se califica según reglas preestablecidas. Permite
comparar estadísticamente la conducta de un sujeto con un grupo de sujetos de una
población definida y clasificarla cuantitativamente, cualitativamente y/o tipológicamente”
(Costa, 1996; pág. 17)
Uso de las pruebas (tests) psicológicas: Las pruebas o tests se usan con motivo de
evaluar aspectos educativos, clasificación por ejemplo la inteligencia, en el área del
trabajo, para la selección de personal, las pruebas también son utilizadas para
diagnosticar la existencia o ausencia de problemas en el comportamiento, son un recurso
importante para comprobar hipótesis de investigación, en la clínica es un método para
diagnosticar comportamiento normal o patológico, o establecer un tratamiento
terapéutico.
Clasificación de las pruebas (tests): Las pruebas pueden clasificarse porsu objetivo
(potencia, ejecución máxima, ejecución de rasgos, o proyectivas). Por la forma o tipo de
respuesta que exigen (pruebas objetivas, subjetivas). Por la forma de administración
(aplicación individual o colectiva). Por la forma de dar las instrucciones.(Morales, 2002;
págs. 24-30).
ACTIVIDAD nº 02
Recolectar los datos implica tres actividades estrechamente vinculadas entre sí:
Este razonamiento nos hace sugerir que es más adecuado definir medición como el
“proceso de vincular conceptos abstractos con indicadores empíricos”, proceso que se
realiza mediante un plan explícito y organizado para clasificar y frecuentemente
cuantificar los datos que me puedan suministrar conductas observables relacionadas con
las variables en estudio. El centro de atención es por lo tanto la respuesta observable
(bien sea una respuesta marcada en un cuestionario, una conducta grabada o una
respuesta dada en una entrevista). Un instrumento de medición adecuado va a ser aquél
que me registra datos observables que verdaderamente representan los conceptos o
variables (más abstractas) que el investigador tiene en mente.
Cabe agregar que un instrumento de medición puede ser confiable pero no válido, puede
medir consistentemente un aspecto más no medir lo que pretende medir el investigador.
Por ello es requisito que un instrumento de medición que demuestre ser confiable y
válido.
d)El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El ruido,
presionar para que una persona conteste un instrumento largo en un período de tiempo
e)El quinto factor se refiere a los aspectos mecánicos. Que el instrumento tenga
instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que no le
falten páginas, que haya un espacio adecuado para contestar.
En la práctica es casi imposible que una medición sea perfecta, generalmente se tiene un
grado de error. Desde luego, se trata que este error sea el mínimo posible y para ello hay
formas de calcular la confiabilidad y la validez.
Método de mitades divididas. Aquí se administra un solo instrumento, una sola vez, pero
se dividen las preguntas o los items (Por ejemplo los items pares con respecto a los
impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los
resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la
confiabilidad varía de acuerdo al número de items de la prueba. Cuantos más items
mayor es la confiabilidad.
Para calcular la validez, la validez que más interesa obtener en una investigación es la
validez de contenido. Para obtener validez de contenido primero que nada hace falta
revisar como ha sido tratada esta variable por otros investigadores anteriormente.
Segundo, elaborar un universo de items tan amplio como sea posible, para medir la
variable en todas sus dimensiones. Posteriormente, se consulta con investigadores
familiarizados con el tema y la variable a medir para ver si el contenido es exhaustivo.
Esto se conoce con el nombre de validación por expertos.
1.El primer paso consiste en listar las variables que se pretenden medir u observar.
Recordemos que las variables son propiedades de los objetos o de los sujetos que
adquieren distintos valores y que son razón de nuestro estudio o fenómeno a investigar.
3.Elegir el instrumento o los instrumentos (ya desarrollados) que han sido favorecidos
por la comparación y adaptación al contexto de la investigación. Deben seleccionarse los
instrumentos que reporten mayor validez y confiabilidad. Si se selecciona un instrumento
desarrollado en otro país deben hacerse pruebas piloto más extensas. Tampoco debe
olvidarse que traducir no es validar un instrumento, por muy buena que sea la traducción.
Variable
Definición operacional
Categorías
Indicadores
Items
Integración escolar
Grado de aceptación de la comunidad escolar regular para aprender y convivir con niños
especiales
Por parte de los Directivos
Interés y voluntad por aceptar niños especiales en su Institución
1.¿Desde hace cuanto tiempo se realiza integración escolar en este Centro?
2.¿De qién fue la iniciativa?
3.¿Cuáles fueron las estrategias para llevar adelante este proceso?
En este caso, debemos asegurarnos de tener un número suficiente de items para medir
todas las variables en todas sus dimensiones.
El nivel de medición nominal indica que hay dos o más categorías de respuesta las
cuales no tienen orden o jerarquía. Por ej. cuando preguntamos el estado civil, la religión,
etc. Las variables nominales pueden ser dicotómicas (admiten solo dos valores, como el
sexo, tipo de escuela a la que asiste : privada u oficial, etc.) y politómicas (cuando
admiten tres valores de medición o más).
El nivel de medición ordinal, indica que hay varias categorías, pero además estas
mantienen un orden jerárquico, de mayor a menor. Por ejemplo el Grado o Nivel de
Instrucción de las personas, el cargo que una persona ocupa dentro de una empresa o
Institución, etc. En los dos niveles mencionados no se pueden utilizar las operaciones
matemáticas básicas, porque sería absurdo y no tiene sentido, darle numeración en
escala a las respuestas.
El nivel de medición por intervalo, implica crear escalas de medición donde las distancias
entre las diferentes categorías de respuestas son iguales. El cero o punto de partida, es
arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa
que no haya temperatura. Algunas escalas de observación y de medición de opinión de
actitudes suelen tratarse como si fueran mediciones de intervalo. Aquí se permite utilizar
las operaciones matemáticas básicas y algunas estadísticas. Ej. las escalas de
evaluación que los estudiantes llenan sobre sus profesores. ¿Cómo considera el sistema
de evaluación de la materia? 1 --- 2 --- 3 --- 4 --- 5 (1 = deficiente, 5 = excelente)
El nivel de medición de razón, además de tener todas las características del nivel de
intervalo (distancias iguales entre las categorías de respuesta y aplicación de
operaciones matemáticas básicas), implica que parte de un cero real y absoluto donde no
existe la propiedad a medir. Por ej. ¿Cuántos hijos tiene usted?
O --- 1 --- 2 --- 3 --- 4 --- 5 --- 6 --- 7 --- 8 --- 9 --- 10 ó más
Indicar cómo se han de codificar los datos . La codificación es necesaria para analizar
cuantitativamente los datos (aplicar análisis estadísticos). La mayoría de las veces se
usan números o cantidades, aunque también se pueden utilizar letras o símbolos.
Aplicar una prueba piloto del instrumento de medición. Es decir, aplicar el instrumento a
personas con características semejantes a las de la muestra o población objetivo de
nuestra investigación
En esta prueba se analiza si las instrucciones se comprenden y si los items funcionan
adecuadamente. Los resultados se utilizan para calcular la confiabilidad y de ser posible,
la validez del instrumento de medición. La prueba piloto se realiza con una pequeña
muestra; los investigadores aconsejan un 10% de personas semejantes a las que
integrarán la muestra definitiva.
ACTIVIDAD nº 03
Desde que la psicología, separada del corpus filosófico que le dio origen, empieza a
desarrollarse como disciplina científica, ha sido atravesada por distintos paradigmas y por
variadas concepciones y epistemologías, que tienen su anclaje en diferentes momentos
socio-históricos. El psicodiagnóstico, o, más específicamente el uso de las técnicas
diagnósticas, probablemente una de las prácticas más vinculadas identitariamente a la
psicología, no escapa a esos cambios, antes bien es causa y a la vez consecuencia de
los mismos.
Si bien a Francis Galton se le reconoce como precursor del empleo de tests para la
evaluación psicológica (1883), James Mckeen Cattell, fue el primero que los aplicó para
medir la inteligencia (1890), y Münsterberg inició los tests de aptitud profesional, no es
menos cierto que ya en 1575 el pregrafólogo español Juan Huarte de San Juan
reclamaba la necesidad de pruebas específicas (psicotécnicos) para los funcionarios de
la administración pública como un medio para conocer las aptitudes psicológicas
individuales y su correcta adecuación profesional.
El propio Alfred Binet junto a Víctor Henri (1895) recurrió el estímulo perceptivo de las
manchas en lo que sería un antecedente de técnica proyectiva formulado más tarde por
H. Rorschach. Será en 1904, cuando Jung elabore la primera prueba proyectiva: el test
de asociación de palabras. Éste se utilizó en criminología, intercalando vocablos
vinculados a los hechos inculpatorios, para estudiar la reacción del sujeto ante esas
palabras con fuerte carga emocional, y sus variaciones fisiológicas en las respuestas
verbales; Jung le llamaba "indicios de complejo". En contraposición Freud no consideraba
válida la práctica de la asociación libre para detectar a sujetos que han cometido un
delito, puesto que él que ha cometido realmente la acción fraudulenta, en la asociación
libre, no deja plenamente libertad, hace esfuerzos por controlar la situación; mientras que
por el contrario el neurótico, por sentimientos de culpa, va a delatarse, por el miedo a que
se den cuenta, precisamente de su miedo a que le crean culpable, es el llamado
delincuente por sentimiento de culpa. (Dr. Jorge Ulnik. Psiquiatra Psicoanalista de la
Facultad de Medicina de la Universidad de Buenos Aires).
Comencemos con una pregunta inicial: ¿Que es un Test?: Una definición sencilla es
considerar a un Test como un instrumento de medición que tiene como finalidad “medir”,
evaluar algún aspecto puntual de la personalidad humana en particular , o el conjunto de
ella.
Rápidamente vendrán a nuestra mente la idea muy cierta por cierto, vale la redundancia,
de la enorme variedad de áreas, aspectos que podremos evaluar de la personalidad tan
rica, multifacético y llena de incógnitas.
Etimologicamente la palabra “Test” nos hemos encontrado que tiene una raíz latina, que
es “Testa” - “Testis” cuya acepción y uso nos remite a la Edad Media, estas se refería a
la vasija de barro que utilizaban los alquimistas para realizar sus experiencias,
recordemos que buscaban transmutar metales comunes en oro. Recordemos que la
Alquimia fue la precursora de la Ciencia conocida luego como Química. Hay mas allá del
experimento con los metales toda una construcción filosófico- espiritual en torno a los
alquimistas que eran considerados en esa época como grandes magos. Muchas
simbologías surgen de allí y en realidad se dice que lo que en el fondo buscaban como
trasmutación real era la de la individualidad humana.. Así transformar en oro los metales
equivale a transformar al hombre en puro espíritu .
Cada Test que los psicólogos e investigadores han construido responden a esta
búsqueda que ha perseguido (positivamente por supuesto) el hombre a lo largo de su
historia , la búsqueda del conocimiento de si mismo, recordemos la famosa y celebre
frase del Oráculo de Delfos que le decía al hombre “conocete a ti mismo” y es esta
necesidad de conocerse la que ha alimentado miles de formas y caminos de acceso a
ese conocimiento en parte posible de conocer y en parte vedado aún. Y aún mas
trascendiendo ya, la búsqueda individual se amplio al conocimiento de otras personas,
esto en la actualidad se lo llama investigaciones transculturales y muchas de ellas entre
ellas el T.A.T (Test de Apercepción Temática de Murray) , se ha aplicado a distintas
poblaciones con distintas culturas con el fin de encontrar semejanzas, y diferencias.
Podríamos decir que cuando aplicamos un Test o una serie de ellos, lo que buscamos es
no solo lograr un conocimiento profundo de una persona, aquellas características que
hacen a su naturaleza básica y aquellas otras que denotan la presencia se áreas
disfuncionales, sino también que ese conocimiento se convierta en información útil no
solo pro-curación de una determinada sintomatología cuyo núcleo o fuente intentábamos
identificar con las técnicas , sino también una información que a través de la devolución
que le otorgamos al paciente o a veces al profesional derivante, ponga de manifiesto
áreas potenciales de salud o recursos que a lo mejor esa persona no tiene a nivel
conciente registro de que los tiene. Conocer áreas desconocidas pero presentes de la
personalidad de uno provoca , a veces una transformación de la personalidad hacia un
nivel superior de funcionamiento que mejore la calidad de vida en un sentido amplio del
paciente o consultante, o un punta pie inicial hacia ella.
Esto implica que el uso de los Test no siempre esta al servicio de la Psicopatología y solo
mente recurrimos a ellos cuando hay alguna disfunción psicológica, sino también
podemos recurrir a ellos para conocerlo mas. Por supuesto los Test deben ser aplicados
por profesionales idóneos en la materia.
ACTIVIDAD nº 04 y 05
¿Cómo elegimos los ítems? - La elección de los ítems la hace el autor de los test,
tomando en cuenta:
Que sean representativos del atributo que quiero medir, ¿cómo se manifiesta ese
atributo? observación directa, definir cuál es la manifestación, tomar datos de campo.
Hasta que punto necesito una precisión de los datos, cuanto más estructurado es un
ítem más preciso es pero menos creativo. Qué quiero evaluar y qué precisión quiero;
me interesan los datos cualitativos o cuantitativos, describir (cualidad, ensayo) o
predecir (cantidad, respuesta alternativa).
Las personas, a quien voy a evaluar, considerar edad, nivel sociocultural, académico,
contexto, ambiente. Variables del sujeto.
Forma de administración: individual o colectiva.
Tiempo disponible (las pruebas verbales son más rápidas de aplicar y corregir que
una manipulativa o gráfica)
Longitud (cuántos ítems tendrá la prueba): Ver la característica que quiero evaluar y lo
amplia que es (p.e. una característica de personalidad es más amplia que el clima
familiar, más concreto), y ver si tengo de esa característica tengo más áreas de
evaluación, si es así necesitaré más ítems. Cada uno de los ítems es una muestra de
conducta, cuántas más tengamos mejor podremos entender al sujeto pero sin perder
el equilibrio (no preguntas en exceso).
Tipo de ítems elegidos (la prueba es más larga o corta según los ítems, las pruebas
verbales tienen más ítems, los manipulativos son menos). Demarcar la longitud del
test.
Finalidad del instrumento, según ella la longitud puede cambiar.
Forma de aplicación. Los test individuales suelen tener menor número de ítems, en
los colectivos se pierden la relación de tú a tú y otra información, hay que tener más
preguntas, son más amplios que los individuales (p.e. tiempo de reacción WAIS,
dificultad de los ítems y cuánto tiempo necesita para pensar y responder).
Características del sujeto. Tiempo de aplicación, si tenemos menos tiempo utilizamos
test cortos. No hay normas fijas, depende de estos apartados y del autor.
dificultad de los ítems: Tomar en cuenta el tipo de prueba, en las de personalidad
tendrá que ser una dificultad media y media-alta, en los test de manipulativos y de
inteligencia existirán diferentes niveles. Por ende, hay que valorar lo que mide la
prueba y el tipo de sujetos a evaluar (tipo de ítems, presentación, áreas de contenido
y características del sujeto marcarán la dificultad). Es importante que el nivel de
lectura o lenguaje de los sujetos evaluados no sea un obstáculo para responder a las
tareas, debe estar adecuado a su nivel de lenguaje. La única excepción sería si se
trata de una prueba en que se evalué el rendimiento en el lenguaje, pero en ellas
poco a poco se va aumentado el grado de dificultad para que el sujeto encuentre
ítems que pueda resolver. (p.e. para un niño son más difíciles los ítems verbales que
los gráficos).
APLICACIÓN, CORRECIÓN Y PROCEDIMIENTOS ESTADÍSTICOS DE LOS ITEMS:
Hay que aplicar el test y para ello tenemos que tener en cuenta:
Delimitar unas normas claras de aplicación.
Tener elegida de forma clara la muestra representativa.
Aplicar el test: Recoger datos significativos.
Ahora hay que hacer un análisis de los ítems a dos niveles:
Cualitativo: análisis lógico- racional.
Cuantitativo: análisis empírico de las propiedades estadísticas de cada uno de
los ítems.
A. ESTADÍSTICA DE ÍTEMS: es tan económica como la anterior. Una sola medida.
Valora la consistencia interna con criterios internos. Comparamos las
puntuaciones de cada ítem con la puntuación obtenida en el test completo.
Se considera a cada ítem como un test individual. Comparación de cada ítem con
la puntuación total del test.
Se supone que todos los ítems tienen la misma varianza y la misma media
utilizamos la formula de Kuder- Richardson.
AVTIVIDAD 06
INSTRUMENTOS PSICOMÉTRICOS
El Mini Mental StateExamination (MMSE) de Folstein.
DESCRIPCION:
Diseñado por Folstein y McHung en 1975, con la idea de proporcionar un análisis breve y
estandarizado del estado mental que sirviera para diferenciar, en pacientes psiquiátricos,
los trastornos funcionales orgánicos.
Hoy en día, se utiliza sobre todo para detectar y evaluar la progresión del Trastorno
Cognitivo asociado a Enfermedades Neurodegenerativas como la de tipo Alzheimer. El
MEC fue la primera versión en castellano del MMSE, adaptada por Lobo y col. La versión
de 35 puntos, fue la primera y es la más utilizada actualmente. Se trata de una sencilla
escala estructurada, que no requiere más de 5 – 10 minutos para su administración.
PUNTUACIÓN:
Excluimos las preguntas que hayan sido eliminadas, básicamente por analfabetismo o
por imposibilidad física de cumplir un ítem (ej.: ceguera). Entonces calculamos la
puntuación total corregida: la obtenida por regla de tres después de corregir la puntuación
total.
Ejemplo, si el paciente es ciego y no puede acceder a 4 de los 35 puntos posibles, la
puntuación final se calculará sobre 31 puntos posibles. Imaginemos que la puntuación
total ha sido 20, aplicando la corrección obtenemos una puntuación (20x35/21) = 22,5
(redondearemos al núm. entero + próximo, el 23).
INTERPRETACIÓN:
DESCRIPCION
Fue diseñado por Pfeiffer en 1975 como test de screening de deterioro cognitivo.Se
encuentra validado en nuestro país por García-Moltalvo.
Explora la:
Memoria a corto plazo.
Orientación.
Información sobre hechos cotidianos, y la Capacidad de cálculo.
INTERPRETACIÓN.
Detecta tanto la presencia de deterioro cognitivo como el grado del mismo. Las
cuestiones con varias respuestas sólo se aceptan como correctas si todos los elementos
de la misma lo son.
Enfatiza mucho el lenguaje y la memoria y tiene una intensa orientación verbal. Por lo
que en algunos tipos de déficit sensoriales o trastornos psiquiátricos (depresión) podría
dar falsos positivos. A pesar de haber sido diseñado para screening, no detecta deterioros
leves ni cambios pequeños en la evolución del deterioro cognitivo.
PROPIEDADES PSICOMETRICAS
- Fiabilidad:La fiabilidad test-retest oscila entre 0,82 y 0,85.
- Validez: Los índices de correlación con otros instrumentos similares: son 0,76 al 0,88
con el Mental Status Questionnaire.
- Sensiblidad: Según varios estudios recogidos por Del Ser la sensibilidad, varía del 68 al
82 % y la Especificidad del 92 al 96%.
Actualmente se conocen más de 100 escalas, lo que nos da una idea de las limitaciones
de estas herramientas y del hecho de que no existe ningún instrumento "ideal".
En las escalas todos los síntomas son igual de importantes y se suman ítems vegetativos
o cognitivos de forma intercambiables. Por eso, estas escalas no permiten realizar el
diagnóstico de dapresión y mucho menos especificar de qué tipo de depresión se trata...
Su función es evaluar la intensidad de los síntomas una vez que se ha realizado el
diagnóstico.
OBJETIVO DE LA ESCALA:
Son 3 los objetivos principales de las escalas para evaluar la depresión:
- Cuantifica la intensidad de la depresión en sujetos ya diagnosticados.
- Evalúa la efectividad del tratamiento.
- Cribaje en población general o en población clínica.
CARACTERISTICAS ESPECÍFICAS:
La primera de las escala desarrolladas para evaluar la depresión fue la de HAMILTON, y
con ella nacía la moderna psicometría.
1. La Escala de HAMILTON. Es la más utilizada y sirve de referencia para todas las
demás. Que deben demostrar una buena validez convergente con ésta....... Su
mayor limitación es que requiere cierto entrenamiento por parte del entrevistador
por lo que encarece su uso.
2. La Escala de BECK. Es la más empleada de las escalas autoadministradas en
depresión.
3. Escala Ansiedad Depresión de GOLDBERG. Es una de los tests utilizado como
instrumento de cribaje en depresión y ansiedad. Es breve, fácil de administrar y
sirve como guía clínica.
4. Escala Ansiedad Depresión Hospitalaria. Especialmente indicada en pacientes
hospitalizados con co-morbilidad orgánica.
DESCRIPCION.
El inventario de Depresión de Beck (BAI) fue desarrollado inicialmente como una escala
heteroaplicada de 21 ítems para evaluar la gravedad (intensidad sintomática) de la
depresión, conteniendo cada ítem varias fases autoevaluativas que el entrevistador leía al
paciente para que éste seleccionase la que mejor se adaptase a su situación; sin
embargo, con posterioridad su uso se ha generalizado como escala autoaplicada.. Beck y
cols.(1979) da a conocer una nueva versión revisada de su inventario, adaptada y
traducida al castellano por Vázquez y Sanz (1991), siendo ésta la más utilizada en la
actualidad.
INTERPRETACION
El paciente tiene que seleccionar, para cada ítem, la alternativa de respuesta que mejor
refleje su situación durante el momento actual y la última semana. La puntuación total se
obtiene sumando los valores de las frases seleccionadas, que van de 0 a 3.
Los puntos de corte usualmente aceptados para graduar la intensidad/ severidad son los
siguientes:
DESCRIPCION:
Este cuestionario fue desarrollado por Wittchen y cols con el objeto de detectar trastornos
de ansiedad generalizada y otros trastornos de ansiedad.
Está basado en el Composite International Diagnostic Interview (CIDI). Su versión 1.2 se
desarrolló para cubrir criterios diagnósticos DSM-IV y ICD-10. Ha sido diseñado para su
uso en atención primaria.
El cuestionario consta de varias secciones:
1. Motivo de acudir a la consulta: es el ítem 1 y recoge una información útil para el
clínico (dolor, estrés emocional o psicológico, enfermedad física o somática...)
desarrollarlo.
(A) los Test clásicos que miden los factores de personalidad como:
Esta escala mide este rasgo, se define como “la necesidad de sensaciones y
experiencias nuevas, variadas y complejas, y el deseo de arriesgarse con el fin
de obtenerlas”.
Se ha empleado en: Individuos con conductas inmaduras. En trastornos de
personalidadad, e incluso en individuos normales que realizan deportes de
riesgo.
DESCRIPCIÓN
CONSTA de 4 Escalas:
Proporciona por tanto 4 puntuaciones distintas (una por escala) y además una
total. En nuestro medio ha sido validada por Pérez y col., en base a trabajos
previos de este mismo autor.
INTERPRETACION.
Se trata de un instrumento adecuado para la investigación del rasgo “búsqueda
de sensaciones” en nuestro medio. No existen puntos de corte propuestos por los
autores y debe interpretarse que puntuaciones + elevadas representan mayor
presencia del rasgo.
Al igual que numerosos estudios, en la validación española se observan
puntuaciones más elevadas en todas las subescalas y la puntuación total en
varones respecto a las mujeres. En varones las puntuaciones más altas se
obtienen en la escala BEM y las menores en la SAB. En mujeres las más altas en
la BEM y las menores en la DES. Existe una relación inversa entre la edad y la
puntuación de la escala.
PROPIEDADES PSICOMETRICAS.
Fiabilidad
Validez
La validez concurrente observada con las diferentes escalas
selEysencjPersonalityQuestionnaire son: Las Escalas E (Extraversión) y P
(Psicoticismo) presentan correlaciones superiores con la escala de Busqueda de
Sensaciones que la escala de N (Neuroticismo).
INTRODUCCION:
Desde la descripción de Demencia precoz por Kraepelin, que se considera el punto de
partida de la psiquiatría moderna, se han intentado identificar grupo de síntomas que
diagnostiquen de forma fiable este trastorno. De hecho, las clasificaciones psiquiátricas
DSM y CIE han intentado, en cada una de sus ediciones, afinar los criterios diagnósticos
en este sentido, sin conseguir acuerdos definitivos.En 1980 Crow y en 1982 Andreasen
defienden la existencia de 2 tipos de síntomas en la esquizofrenia: Positivos y
Negativos, con sus correlatos biológicos y de neuroimagen.
En 1987, Liddle revisa este modelo y sugiere uno tridimensional con las categorías de
Positivo-paranoide, Negativo-Deficitario y desorganizado y hefebrénico. En 1990, Kay y
Sevy proponen un modelo de 4 factores:: Positivo, Negativo, Agitación y Depresión.
Por último, Linstrom y Von Knorring entre otros autores, proponen un sistema
pentadimensional con las siguientes dimensiones: negativo, Positivo, Disfunción
cognitiva, Ansiedad / Depresión y Excitación. Todas estas propuestas cuentan con
estudios que poyan y con otras que los invalidan, y cualquier otra alternativa nosológica
resulta igualmente endeble.
En este momento se acepta que la esquizofrenia es un grupo hetereogéneo de
enfermedades cuya clasificación se encuentra en contínua revisión. La consecuencia es
que no hay un “patrón oro”, por lo que las escalas de evaluación , basadas en alguno de
los modelos descritos, se emplean para validar o rechazar dichos modelos,
produciéndose un error autológico metodológicamente inaceptable. Este problema casi
específico de la esquizofrenia, no parece que vaya a subsanarse en los próximos años,
por lo que va a implicar limitaciones importantes desde el punto de vista de la
Psicometría.
TIPOS DE ESCALAS:
Los principales aspectos que pueden evaluarse en la esquizofrenia son los siguientes:
1)Instrumentos para evaluar la PSICOSIS en general. Por las características
específicas de la Psicosis (la falta de conciencia de enfermedad en la mayoría de
estos enfermos), las escalas tienen que ser heteroevaluadas ya que el paciente
frecuentemente no va a colaborar.
Dentro de este grupo, la BPRS (ESCALA BREVE DE EVALUACION PSIQUIATRICA)
es no solamente la escala más utilizada con esta función, sino el test psiquiátrico
más empleado a nivel internacional junto a la escala de Hamilton de Depresión.
Inicialmente se empleó para monitorizar el tratamiento farmacológico en pacientes
CONCEPTOS:
TIPOS DE TETS:
1. Individuales. (más fiables que los grupales).
2. Grupales. Autoadministrados, y de Realización.
3. Verbales:
PM – 38
Desarrollamos los que más nos puedan ayudar a la hora de valorar el Nivel o Coeficiente
de Inteligencia.
ACTIVIDAD 07 y 08
A) Coeficiente de confiabilidad
Es un coeficiente de correlación entre dos grupos de puntajes e indica el grado en que los
individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1.
Cuanto más se acerque el coeficiente a 1, más confiable será la prueba. El coeficiente de
confiabilidad señala la cuantía en que las medidas del test están libres de errores
casuales o no sistemáticos.
Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas
de aplicación del test el 95% de la varianza de los puntajes directos se debe a la
auténtica medida, y sólo el 5%, a errores aleatorios.
Existen cuatro métodos básicos para obtener el coeficiente de confiabilidad (rxx): Método
de las formas equivalentes; método del test-retest; método de la división por mitades
emparejadas o "Split half method"; y método de la equivalencia racional o de Kuder-
Richardson.
a) Método de las formas equivalentes: Se aplican dos formas equivalentes o paralelas del
test al mismo grupo de individuos, y las dos series de puntajes resultantes se
correlacionan con el coeficiente producto de los momentos de Pearson (r).
b) Método del test-retest: Se aplica dos veces el mismo test (el lapso entre las
aplicaciones se determina previamente), a una misma muestra de individuos. Las dos
series de puntajes resultantes se correlacionan con el coeficiente de correlación "r" de
Pearson.
c) Método de la división por mitades emparejadas o "split half method": Se aplica el test
una sola vez a una muestra. Luego, se califica por separado los ítemes pares (2, 4, 6, ...,
n) y los ítemes impares (1, 3, 5, ..., n). A continuación, las dos series de puntajes
resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido
el test en dos partes (ítemes pares e ítemes
impares), el "r" resultante debe ser "corregido" para arrojar el "r" para todo el test. Esta
corrección se efectúa con la fórmula de profecía de Spearman-Brown:
d) Método de la equivalencia racional: En este método se considera que si un test esta
formado por un conjunto de ítemes estos pueden ser considerados como un conjunto de
tests paralelos (tantos como ítemes tenga el test). Luego se deriva una ecuación para
computar el coeficiente de confiabilidad. Kuder y Richardson
derivaron varias fórmulas para el cálculo del coeficiente de 94 Psicometría
confiabilidad, son las más conocidas la KR20 y la KR21. Actualmente, un coeficiente más
utilizado es el coeficiente alfa de Cronbach
(1972; Anastasi, 1982; Aiken, 1995).
Validez
Si tenemos una prueba “X” nos equivocaríamos al creer que su titulo nos dice lo que la
prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a
obtener una medida, por ejemplo, de razonamiento numérico o de las estrategias de
aprendizaje. La averiguación de lo que la prueba mide no responde a la pregunta ¿cómo
llama el autor a la prueba?, sino más bien ¿a qué hacen referencia los puntajes obtenidos
en esta?, ¿es válido el uso o la interpretación de las puntuaciones de este test?, ¿qué
generalizaciones se pueden hacer apropiadamente a partir de la puntuación en esta
prueba? (Thorndike, 1989). En esencia, el trasfondo de estas preguntas es determinar
cuáles son los procesos mentales que pone en juego el test. Ahora bien, el responder a
las Jaime Aliaga 95 citadas interrogantes necesita de una indagación larga y compleja
que en psicometría se denomina proceso de validación.
(1) Validez de Contenido (evidencia del contenido).- ¿Los ítems que constituyen el test
son realmente una muestra representativa del dominio de contenido o dominio conductual
que nos interesa?
Es conveniente precisar que un dominio o campo conductual es una agrupación
hipotética de todos los reactivos posibles que cubren un área psicológica particular. Al
hablar de este conjunto de reactivos posibles, se emplean los términos de dominio,
universo o población conductual como sinónimos. Por ejemplo: Un test de vocabulario
debe ser una muestra adecuada del dominio o universo de ítems posibles en esta área.
La validez de contenido consiste en determinar lo adecuado del muestreo de reactivos
del universo de reactivos posibles; en este sentido, es una “medida” de lo adecuado del
muestreo. Ponemos “medida” entre comillas debido a que este tipo de validez consiste en
98 Psicometría una serie de estimaciones u opiniones, que no proporcionan un índice
cuantitativo de validez (para su obtención no se utiliza procedimientos estadísticos). Este
tipo de validez se asocia fundamentalmente a los tests de aprovechamiento o rendimiento
(test
de matemática, historia, etcétera); aunque no existen razones para que no pueda
aplicarse a los otros tipos de pruebas psicológicas (pruebas de aptitudes, habilidades,
etcétera). Para su determinación se compara sistemáticamente los reactivos del test con
el dominio conductual del contenido postulado. Por ejemplo: si tenemos una lista de 500
palabras que esperamos que los estudiantes de un curso sean capaces de escribirlas
correctamente al final de este, su performance o rendimiento respecto a estas palabras
será importante solamente en tanto que proporciona una prueba de su habilidad para
escribir correctamente las 500 palabras. El test que construyamos tendrá una muestra de
las 500 palabras, pero sólo tendrá validez de contenido en la medida en que proporcione
una muestra adecuada de las 500 palabras que represente. Si seleccionamos solamente
palabras fáciles o difíciles, o palabras que representen únicamente ciertos tipos de faltas
comunes de ortografía, estaríamos propensos a obtener una validez de contenido muy
baja. En consecuencia, el aspecto clave en la validez de contenido es el muestreo de los
reactivos. En otras palabras, la validez de contenido es cuestión de determinar si la
muestra de sus reactivos es representativa del universo o dominio conductual de ítems al
que supuestamente representa. Para hacer esta determinación se recurre a “jueces” (o
expertos, generalmente en número impar). El proceso es básicamente lógico y racional,
los distintos jueces pueden no estar de acuerdo en la validez de contenido de un test; por
ejemplo, la falta de claridad en la especificidad del dominio conductual, hará que resulten
difíciles los juicios de validez de contenido. Existen algunos índices estadísticos para
valorar el grado de acuerdo de los jueces en torno a los reactivos, por ejemplo el
coeficiente V de Aiken. Un procedimiento para que el proceso de “enjuiciamiento” de los
reactivos sea lo más objetivo posible, es el siguiente:
- El constructor de la prueba:
* Define específicamente el dominio del contenido por medio de una descripción que lo
debe delimitar claramente. Jaime Aliaga 99
* Define, si fuera necesario, subcategorías importantes del dominio, especificando esta
importancia en términos porcentuales.
- Los jueces:
* Determinan si los reactivos sometidos a su consideración pertenecen o no al dominio
definido así como también si, tomados en conjunto, tienen una proporción adecuada.
* También enjuician la bondad de la redacción de los
elementos. Es usual considerar en los tests de aprovechamiento escolar a este tipo de
validez como un concepto similar al de validez curricular. Por otro lado, es necesario
diferenciar la validez de contenido de la llamada validez de facie. Esta última se da
cuando se revisa superficialmente los reactivos y se consideran que los ítems “parece”
que miden lo que se supone tienen que medir. Esta validez puede ser una consideración
importante a tener en cuenta, si la “apariencia” de los ítems influye en la motivación del
sujeto. Por ejemplo, si en un test para adultos se incluyen reactivos en lenguaje y
contenido infantil, se dirá que este test no tiene validez de facie; el sujeto puede no
sentirse motivado a obtener buenos resultados al sentir que la prueba es poco importante
para la decisión que se va a tomar.
(2) Validez Predictiva (evidencia externa) - ¿Predicen las puntuaciones del test un
rendimiento o conducta futura? (Junto con la validez concurrente se le denomina también
validez empírica del test).
Un uso común de los tests es predecir la conducta futura; utilizamos el test para
ayudarnos a tomar alguna decisión práctica (selección, clasificación, etc.). En cada una
de estas situaciones, cuanto mayor es la exactitud de predicción del resultado (es decir
del criterio externo), tanto más útil será la prueba. Por ejemplo, el test será un
componente aceptable de un proceso de selección de
personal, si sus calificaciones o puntuaciones predicen la ejecución de algún componente
importante del trabajo (criterio externo); en otras palabras, para que el test se pueda
utilizar como parte de un proceso de selección es preciso demostrar la validez de la
prueba relacionándola con los criterios pertinentes. En este sentido, el contenido de la
prueba pasa a tener un lugar secundario, siendo el interés fundamental del psicólogo el
averiguar si el test predice un criterio determinado. 100 Psicometría Para este logro es
necesario que los criterios externos con los cuales se relacionará las puntuaciones del
test sean criterios validos y confiables.
Un criterio es cualquier desempeño que los sujetos tienen en la vida real, por ejemplo, las
medidas de rendimiento académico, medidas de rendimiento laboral, clasificaciones
psiquiátricas, etcétera. En muchos casos resulta imposible hallar un criterio no ambiguo
de un rasgo mental. Por ejemplo, dos psicólogos, Carla y Abel, que investigan el rasgo de
aptitud numérica pueden emplear diferentes criterios externos para correlacionar los
puntajes del test que han creado. Así, Carla puede considerar que el criterio externo más
adecuado son las calificaciones que reciben los sujetos en un curso de mecánica en
taller; mientras que Abel puede considerar como criterio el periodo de tiempo que gastan
los estudiantes en aprender una tarea mecánica y sencilla durante el entrenamiento en
un fabrica. ¿Qué sucede si las pruebas que emplean ambos psicólogos correlacionan
0.006 con uno de los criterios, y 0.70 con el otro?, ¿cómo podemos afirmar que la prueba
es valida cuando arrojan resultados de cierta clase?, ¿se trata en verdad de una prueba
de aptitud mecánica? En razón a situaciones como esta se llego a la conclusión de que la
validación de un test es un proceso largo y no un hecho aislado. Solamente a través de
estudios de correlación con una amplia variedad de criterios podremos comprender que
mide la prueba. Así, una serie de investigaciones sobre la “prueba de actitud mecánica”
nos puede demostrar que en realidad esta midiendo la habilidad para realizar
movimientos fino y cuidadosamente controlados, siendo completamente independiente
para comprender las reacciones complejas de la piezas mecánicas. De esta manera el
test puede tener una alta correlación con las calificaciones obtenidas en el taller y
ninguna con los trabajos e maquinarias. En el proceso de validación, la validez predictiva
de un test (y también la concurrente) se expresa generalmente por medio de un
coeficiente de correlación entre los puntajes y los denominados criterios. Este coeficiente
se denomina coeficiente de validación. La interpretación de este coeficiente requiere un
dominio excelente del análisis estadístico utilizado para obtenerlo. Después del criterio,
los procedimientos estadísticos adquieren vital importancia para obtener esta categoría
de validez. Incluso para un mejor análisis es conveniente contar con el dispersigrama o
scatergrama o “nube de Jaime Aliaga 101 puntos” (gráfica del coeficiente de correlación
entre las puntuaciones del test “X” y las del criterio “Y”).
(3) Validez Concurrente.- ¿Permiten las puntuaciones del test la valoración de ciertos
hechos presentes? Para estimarla se administra el test y se le correlaciona con el criterio.
La diferencia con la validez predictiva se da en dos aspectos: a) las medidas del test y del
(4) Validez de Constructo.- El constructo viene a ser un concepto hipotético que forma
parte de las teorías que intentan explicar la conducta humana: inteligencia, creatividad,
dependencia de campo, etc. La validez de constructo es la obtención de evidencias que
apoyan que las conductas observadas en un test son (algunos) indicadores del
constructo. Este tipo de validez responde a la
pregunta "¿cómo se puede explicar psicológicamente la puntuación del test?". La
respuesta a esta pregunta puede verse como la elaboración de una “miniteoría” acerca
de una prueba psicológica. La lógica de la validez de constructo en muchos aspectos así
como en sus métodos, es esencialmente la del método científico. El proceso de
validación de constructo implica a partir del
establecimiento de deducciones de la teoría:
a) Formular hipótesis y relaciones entre elementos del constructo, de éste con otros
constructos de la teoría y con otros constructos externos. 102 Psicometría
b) Seleccionar ítemes o tests (indicadores) que representen manifestaciones concretas
del constructo.
c) Recogida de datos.
d)Establecer consistencia entre datos e hipótesis, y examinar el grado en que los datos
podrían explicarse mediante hipótesis alternativas.
Hay diversos procedimientos para establecer la validez de constructo. Si elaboramos una
“miniteoría” esta tendrá tres pasos: (1) en base a la teoría sostenida en ese momento
respecto del test, el psicólogo deduce ciertas hipótesis sobre la conducta esperada de las
personas que obtienen puntajes diferentes en el test, (2) se reúne datos que confirman o
no esas hipótesis, (3) en base a los datos acumulados, se toma la decisión relativa a si la
teoría explica adecuadamente los datos. Si no es así se tiene que revisar la teoría y
repetir el proceso hasta lograr una explicación más adecuada. El proceso de validación,
en ese sentido, es de continua reformulación y refinamiento.
Al determinar la validez de construcción, el propósito es identificar todos los factores que
influyen en la ejecución del test y determinar el grado que influyen cada uno de ellos.
Ejemplo: Un psicólogo construye un test de ansiedad y elabora una “microteoría” cuya
contrastación le dirá si el test tiene validez de constructo. Las hipótesis a verificar son las
siguientes:
1. Los que obtienen puntuaciones elevadas acabarán probablemente en clínicas
psiquiátricas en comparación con aquellos de puntuaciones más bajas.
2. Será más fácil que les receten drogas psicotrópicas a los que tienen altas
puntuaciones que a los de bajos puntajes.
3. Los hijos de los de puntuaciones altas tendrán mayores probabilidades de tener una
puntuación alta en el test que los hijos de quienes tuvieron puntuaciones bajas.
4. El test de ansiedad se correlacionará alta y significativamente (más allá de 0.60) con
otros test de ansiedad.
5. El test de ansiedad no se correlacionará con variables que no resulten conexas con la
misma.
6. Los grupos psiquiátricos caracterizados como ansiosos alcanzarán en el test unas
puntuaciones más altas que los del grupo control. Jaime Aliaga 103
CONCLUSIONES
1) La psicometría es una disciplina de la psicología cuya finalidad intrínseca es la de
aportar soluciones al problema de la medida en cualquier proceso de investigación
psicológica; constituye, por ello, un campo metodológico que incluye teorías, métodos y
usos de la medición psicológica, tanto a nivel teórico como a nivel práctico.
2) En psicología, medir es dar la magnitud de cierta propiedad o atributo, por ejemplo, la
inteligencia, la extraversión, el razonamiento verbal, de una o más personas, con ayuda
del sistema numérico.
3) El test psicométrico es un procedimiento estandarizado compuesto por ítemes
seleccionados y organizados, concebidos para provocar en el individuo ciertas reacciones
registrables; reacciones de toda naturaleza en cuanto a su complejidad, duración, forma,
expresión y significado.
4) Los requisitos de un test psicométrico son: Construcción del test; la situación de
aplicación del test; el registro del comportamiento provocado en el sujeto examinado, que
debe ser preciso y objetivo; el comportamiento registrado evaluado estadísticamente con
respecto a un grupo de individuos denominado
grupo de referencia o grupo normativo; clasificación de los sujetos examinados en función
de normas resultantes del examen previo del grupo de referencia o normativo (baremo),
lo que permite situar cada 106 Psicometría una de las respuestas, en una distribución
estadística (contraste);.las respuestas a las cuestiones planteadas deben dar una medida
correcta del comportamiento al que el test apunta (validez); y por último, la repetición del
examen debe conducir siempre al mismo resultado (fiabilidad).
5) La estandarización es el proceso mediante el cual se establecen procedimientos
unívocos para la aplicación, calificación e interpretación de un test psicométrico.
6) La interpretación de los puntajes de un test psicométrico estandarizado se refiere al
significado que se les da a los puntajes obtenidos por un grupo de sujetos, al compararlos
con una tabla de normas o baremo, estableciendo una clasificación de acuerdo a la
conversión de sus puntajes directos en puntajes percentiles, eneatipos o decatipos.
7) Los tests psicométricos se clasifican por lo siguiente: Por su forma de dar las
instrucciones; por su forma de administración; por la forma o tipo de respuesta que
exigen; por el material de la prueba; por su forma de calificación; por sus edades límites
de aplicación; y por su libertad de ejecución. En los test psicométricos utilizados en
educación existe actualmente un tipo de tests denominado test relacionado con el criterio.
8) El test psicométrico es empleado como instrumento auxiliar para una mejor toma de
decisiones: En la selección, clasificación, diagnóstico, investigación, y evaluación de un
determinado grupo de personas.
9) Entre las limitaciones en el uso de un test psicométrico tenemos: Una prueba o test
sólo puede medir aquellos aspectos para los que ha sido construido; las normas (baremo)
de una prueba no tienen validez universal; si las condiciones que influyen sobre el
individuo se modifican, existe la posibilidad de que tales cambios durante la aplicación de
la prueba influyan en los puntajes resultantes
del test; los resultados de un test no deben emplearse para diagnosticar per se estados
patológicos;.y, finalmente, las categorías descriptivas (inteligencia muy superior, superior,
etc.) sólo deben utilizarse para los tests cuyos puntajes le dieron origen.
10) Un test psicométrico tiene generalmente las siguientes secciones o partes: El test
propiamente dicho, y el manual del test.
11) Entre las cualidades que debe tener un test psicométrico, hay que tener en cuenta: la
confiabilidad, que puede estimarse a Jaime Aliaga 107
través de dos procedimientos: el coeficiente de confiabilidad y el error estándar de
medida (EEM); y la validez, que es el grado en que una prueba mide lo que intenta medir.
12) La validez científica de un test la da la validez de constructo. La tendencia ya no es
hablar de tipo de validez, sino de categorías de validez en la que la validez de contenido,
validez predictiva, validez concurrente y validez de constructo reconstituyen en
estrategias de validación.
13) La teoría de respuesta al ítem (TRI), denominada también Teoría del Rasgo Latente,
es un modelo probabilístico que permite conocer la información proporcionada por cada
ítem, y así crear tests individualizados, es decir, a medida. Los supuestos de la TRI son:
la unidimensionalidad del rasgo latente; y la independencia, es decir, que las respuestas
de un examinado a cualquier par de ítemes son independientes.
Actividad 10 y 11
MEDICION Y EVALUACION
Medición: medida interpretada que es implícita a la medición de un test.
Objetiva: método y procedimiento en la administración de un instrumento sin influencia
de factor externo; que al ser repetida en igualdad de circunstancias los resultados deben
ser iguales.
Tipificada: debe ser aplicable a una población diferenciada por ciertas características.
Muestra de conducta : es muestra ya que ningún tipo de comportamiento es posible de
medir completamente, lo que hacemos es aproximarnos a su medición a través de una
muestra.
MEDICIÓN: Consiste en reglas para asignar símbolos a objetos de manera que:
1. Representen numéricamente cantidades de atributos (escalas de medida).
2. Definan si los objetos caen en las mismas categorías o en diferentes con respecto a un
atributo determinado (clasificación).
Tanto las escalas de medición como la clasificación implican la formulación y evaluación
de reglas. Estas reglas son usadas para medir atributos de los objetos, por lo general,
pero no de manera exclusiva, sino también de personas. Es importante recordar que
podemos medir sólo atributos de los objetos, no a los objetos mismos. Entre las
características de las buenas reglas están la receptibilidad (confiabilidad) y de modo más
importante, la validez en los sentidos que se describan. La estandarización es un objetivo
importante de la medición debido a que facilita la objetividad, cuantificación,
comunicación, economía y generalización científica.
La medición usa matemáticas, pero las dos sirven a papeles separados. La medición
necesita relacionarse con el mundo físico, pero las matemáticas puras sólo se ocupan de
la consistencia lógica. Un aspecto tradicionalmente importante, pero controvertido de las
escales de medición, es que estas por lo general caen en uno de cuatro niveles (han sido
sugeridos otros); nominal, ordinal, de intervalos y de razón. Estos cuatro niveles
representan de manera progresiva reglas mejor articuladas, por ejemplo, las escalas
nominales tan sólo definen si dos (2) objetos son equivalentes o no, entre sí, con
respecto a un atributo crítico, pero las escalas ordinales determinan si un objeto que no
es equivalente a otro es mayor o menor que el otro; son posibles resultados más
consistentes con niveles superiores de medición. El concepto de invarianza es básico
para estos niveles de medición, el cual tiene que ver con lo que permanece igual cuando
se realizan cambios permisibles en la escala. Las escalas de niveles superiores están
más restringidas en cuanto a la manera en que pueden ser transformadas y aún
conservar invarianzas claves.
ESCALAS DE MEDICIÓN.
Stevens propuso que las mediciones entran en cuatro (4) clases principales de escala de
medición (nominal, ordinal, de intervalo y de razón), las cuales permitieron que se
ejecutaran en las medidas, procedimientos cuantitativos cada vez más complicados, pero
a su vez demandaron cada vez más de las operaciones de medición.
Escalas de Medición:
* Nominal: contiene reglas para decidir si dos (2) objetos son equivalentes o no para una
categorización. El resultado de una escala nominal, es una serie de clases, a las cuales
podría darse una designación numérica. Es importante distinguir entre usar categorías
"Nombres" lo cual es impropio y la categoría "Frecuencias" la cual es bastante apropiada.
* Ordinal: contiene reglas para decidir si un objeto es diferente a otro es mayor o menor
con respecto a un atributo determinado.
* De Intervalo: relfejan operaciones que definen una unidad de medición; así como
mayor, igual o menor.
* De Razón: es una escala de intervalo con un cero (0) racional (verdadero), en lugar de
un cero (0) arbitrario. Un cero (0) racional significa la ausencia del atributo y no
simplemente razonable.
TIPOS DE PRUEBAS
A.- DE INTELIGENCIA
-MATRICES DE RAVEN:
Consiste en descubrir qué figura corresponde al cuadro en blanco de los otros que
aparecen en la parte inferior. Las figuras pueden ser abstractas u objetos que mantienen
un orden lógico. Interesan la identificación y la diferenciación de formas.
Son ejercicios en orden de dificultad creciente. El tiempo está limitado, con lo cual hay
que evitar estancarse en un ejercicio.
B.- DE PERSONALIDAD
Test de personalidad: Tratan de buscar rasgos de carácter, acordes con el perfil del
puesto: introvertido o extrovertido, dinámico o pasivo, optimista o pesimista, con iniciativa
o sumiso, impulsivo o moderado, etc.
Test de aptitudes administrativas: Sirven para medir la capacidad de percepción, rapidez
de lectura, de precisión en actividades específicas, cálculo aritmético, comprobación de
datos, ortografía, archivo, comprobación de errores, etc.
Pruebas psicométricas y proyectivas:
CLEAVER
Prueba que describe el perfil laboral de cada candidato. Describe el comportamiento y
habilidades del personal en la organización, apoyando los programas de Planeación de
Recursos Humanos, mejorando la comunicación y el desempeño en el trabajo
* COMPORTAMIENTO DIARIO
INDICADORES DE MOTIVACIÓN
TERMAN MERRIL
Prueba para la medición del Coeficiente Intelectual I.Q., conocimientos generales,
comprensión, análisis y síntesis, razonamiento, aritmética, juicio práctico, sentido común
y capacidad de deducción.
Proporciona una medida de la inteligencia para examinados adultos, esta orientado para
personas de nivel escolar bachillerato o superior.
BARSIT
Determina rápidamente el nivel de inteligencia o aptitud para aprender. - Compara la
composición de grupos, selecciona previamente casos excepcionales. - Adaptabilidad del
sujeto.
KOSTICK:
El Inventario de Preferencias y Percepciones de Kostick es un instrumento diseñado para
ayudar a comprender los estilos administrativos de las personas, que permite evaluar a
los candidatos a un puesto y a descubrir gente de éxito en las organizaciones.
MACHOVER:
Prueba proyectiva mediante la cual se evalúa maduración, organicidad y cuadros
patológicos.
La personalidad se desarrolla a través del movimiento, sentimiento y pensamiento de un
cuerpo específico.
Los métodos proyectivos han puesto repetidamente determinantes profundos y quizás
inconscientes, de expresión propia, los cuales no podrían manifestarse en comunicación
directa.
Toda actividad creadora lleva el sello específico de conflicto y necesidades que presionan
sobre el individuo que está creando. La actividad despertada como respuesta a "Dibuje
una persona", es en verdad una experiencia creadora. El dibujo de la figura humana
indica una unión entre la figura y la personalidad del individuo que la realiza.
ZAVIC
Prueba para evaluar los valores e intereses de los individuos: Consta de 20 preguntas
con cuatro opciones cada una, se divide en dos áreas : Valores : Moral, Legalidad,
Indiferencia y Corrupción Intereses : Economico, Politico, Social y Religioso.
Otras....
Actividad 12 AL 15
Observemos como antes que esta desviación estándar tiene la misma unidad que las
observaciones. En rigor es un promedio de las diferencias cuadráticas de las
observaciones respecto de la media. El cuadrado permite eliminar los signos negativos,
de modo que no se anulen diferencias simétricas en torno de la media.
PERCENTILES (PI)
Son los valores que dividen a la distribución en 100 partes iguales, cada una de las
cuales engloba el 1 % de las observaciones. En total habrá 99 Percentiles. (Q2 = D5 =
Me = P50)
COEFICIENTE DE CORRELACIÓN
Un coeficiente de correlación se dice que es significativo si se puede afirmar, con una
cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos,
preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa
que preguntarse por la probabilidad de que tal coeficiente proceda de una población
cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hipótesis
posibles.
TRANSFORMACION DE PUNTAJES DIRECTOS A PUNTUACIONES ESTANDAR
Esta técnica es la más conocida y utilizada en el marco de la TCT, al punto que muchos
usuarios asumen que es la única existente para estimar la Puntuación Verdadera. Se trata de
un procedimiento ampliamente recomendado por muchos autores (e.g. Allen & Yen, 1979;
Anastasi & Urbina, 1998; Felt & Brennan, 1989; Gulliksen, 1950) que consiste en utilizar el
EEM para construir un intervalo de confianza en torno a la Puntuación Observada.
Teóricamente, el procedimiento se fundamenta en asumir que los errores de medida se
distribuyen normalmente. Bajo este supuesto es posible utilizar el EEM para construir un
intervalo de confianza para la Puntuación Verdadera, en torno a la Puntuación Observada.
Sin profundizar en la derivación de la fórmula (para tal efecto ver, por ejemplo, Muñiz, 2001),
las ecuaciones para el límite inferior y superior del intervalo de confianza corresponden a:
ejemplo, a una desviación típica por encima y por debajo de la Media se encuentra el
68,26% de la distribución. El cálculo de la Desviación Típica se realiza mediante el
cálculo de la raíz cuadrada de la sumatoria de los desvíos de los puntajes con respecto a
la media elevados al cuadrado. Es también la raíz cuadrada de la Varianza.
Dificultad de los ítems. El grado de dificultad de un ítem se determina mediante la
proporción de respuestas correctas (cociente entre respuestas correctas divididas entre el
número de respuestas totales). La proporción que se obtiene se denomina a la media del
ítem, o “la p del ítem” y es un indicador directo de su facilidad, o inverso de la dificultad,
ya que su valor, comprendido entre 0 y 1, indica que mientras más se acerca a 0 es más
difícil el ítem (puesto que fue respondido por un menor número de personas) y mientras
más se acerca a 1 es más fácil (respondido por un mayor número de personas).
Error Estándar de Medida Sem. Es un estadístico que estima la posible magnitud del
error presente en un puntaje individual. El Error Estándar de Medida indica la diferencia
que puede existir entre el Puntaje Obtenido y el Puntaje Real o Verdadero (T), que se
supone que refleja la verdadera posición del individuo en un continuo subyacente; esa
diferencia se debe a errores de medida. Mientras mayor es el Error Estándar de Medida,
menos confiable es la puntuación obtenida. El Error Estándar de Medida es una magnitud
tal, que en aproximadamente dos terceras partes de los casos, el puntaje obtenido no
diferirá más de un Error Estándar por encima o por debajo del Puntaje Real. En teoría se
puede decir, que en 2 de cada 3 casos, el puntaje obtenido se encuentra en una banda
que se extiende del Puntaje Real más o menos un Error Estándar de Medida; pero debido
a que el Puntaje Real nunca se puede conocer, la práctica establece que, para la
interpretación, se puede revertir la relación Puntaje Verdadero – Puntaje Obtenido.
Escala. La sucesión de números en función de los cuales se realiza la medición.
Clásicamente se distinguen cuatro niveles: Nominal, Ordinal, Intervalo, Razón. También
se entiende por escalas, las transformaciones de puntajes que se realizan a escalas de
propiedades conocidas, tales como Estaninas Percentiles, puntaje Z, Puntaje H, etc.
Estadística Descriptiva e Inferencial. La E. Descriptiva es una rama de la estadística
aplicada que permite describir las características de las distribuciones en función de los
datos obtenidos. La E. Inferencial es una rama de la estadística que permite realizar
inferencias sobre el comportamiento de los estadísticos en la población o un segmento de
ella. Ambas son absolutamente necesarias en el trabajo estadístico de los datos
psicométricos.
Frecuencia. Es el número de observaciones que corresponde a un determinado puntaje
en una escala. Usualmente las observaciones son los sujetos que obtuvieron ese puntaje.
Frecuencia Acumulada. Es el número de observaciones acumuladas hasta el límite
superior de un determinado puntaje en una escala. Se acumula siempre desde las
puntuaciones más bajas en la Escala hacia los más altos.
Inventario de Personalidad. Es un tipo de Prueba Psicométrica que consiste en un
cuestionario o lista de chequeo, usualmente autoadministrada, diseñada para obtener
información de variables no intelectuales de un individuo. Los inventarios usualmente
evalúan rasgos tales como intereses, actitudes, motivación, etc. (véase Pruebas de
Personalidad).
Ítems. Son los estímulos o reactivos que se presentan a los sujetos para que respondan
y pongan de manifiesto conductas asociadas con un atributo determinado. Dependiendo
del tipo de prueba, los ítems varían sustancialmente. Un tipo común de ítem son los de
opciones múltiples, que presentan un problema en el “pie” y varias opciones de respuesta
de las cuales sólo una es la correcta (la clave) y las otras son Distractores, que sirven
para atraer la respuesta de quienes no conocen realmente la respuesta correcta.
Media o Media Aritmética. Es el promedio de las puntuaciones obtenidas por un grupo
en un test. Se obtiene mediante la suma de las puntuaciones y la división
entre el número de ellas.
Medición. Consiste en la asignación de numerales a las propiedades de los objetos o
eventos de acuerdo a ciertas reglas (Stevens). En medición psicológica, los objetos son
las manifestaciones de los atributos psicológicos o constructos. Se fundamenta en varios
supuestos: a) la asunción de la existencia de un continuo subyacente con direccionalidad,
b) la existencia de un solo puntaje verdadero para cada sujeto, c) la variabilidad entre
BIBLIOGRAFÍA
REFERENCIAS DE LA WEB:
http://www.gestiopolis.com/canales8/rrhh/psicometria-como-ciencia-del-
compotamiento-y-los-recursos-humanos.htm
http://www.uam.es/docencia/ace/
http://www.uaim.edu.mx/web-
carreras/carreras/Etnopsicologia/07%20TRIMESTRE/PSICOMETRIA.pdf
http://html.rincondelvago.com/psicometria_5.html
http://es.wikipedia.org/wiki/Teoría_de_respuesta_al_ítem
http://es.wikipedia.org/wiki/Test_psicológico