Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Por otro lado los test son un instrumento de evaluación cuantitativa de los atributos psicológicos
de un individuo. Son técnicas sistemáticas que comparan la conducta de dos o más personas (los
test permiten seleccionar y clasificar a cada individuo en determinado contexto, valorizar los
procedimientos, verificación de hipótesis científicas. Deben tener validez y confiabilidad).
Clasificación de pruebas:
- Según la eficiencia de test y su administración: Las pruebas individuales son aquellas que se
administran a un examinado en cada ocasión. Por su parte, las pruebas colectivas son las que se
administran en simultáneo a varios examinados.
- Según el tiempo límite que se da al examinado para resolver una prueba: Las pruebas de
velocidad constan de muchos reactivos pero los límites de tiempo son estrictos, es ver hasta
dónde llega. En cambio en las pruebas de potencia los límites de tiempo son más amplios, pero
los reactivos generalmente son más difíciles.
- Según el método para clasificar una prueba: Las pruebas objetivas tienen normas de
calificación precisas claramente establecidas y pueden ser calificadas por un empleado. Las
pruebas no objetivas se califican subjetivamente y los resultados pueden variar e/ calificadores.
-Según tareas que se le pide a los evaluados o tipo de material y forma de respuesta requerida:
Las pruebas verbales o lingüísticas exigen respuestas orales o escritas. Las pruebas de
ejecución no verbales o no lingüísticas se le pide a los evaluados seleccionar las respuestas
correctas, construir algo o manipular materiales de prueba.
-Según su contenido o proceso: Las pruebas cognoscitivas tienen como objetivo cuantificar los
procesos y productos de la actividad mental, son de dos tipos aunque no son separados:
. Pruebas de rendimiento: evalúa el conocimiento de algún tema y ocupación académica y se
centra en el comportamiento pasado del examinado, es decir lo que ya ha aprendido o logrado.
. Pruebas de aprovechamiento: se enfoca al comportamiento a futuro, a lo que la persona es
capaz de aprender con la capacitación apropiada. Por su parte, las pruebas afectivas evalúan
características de personalidad no cognoscitivas (intereses, actitudes, valores, motivos, carácter).
Objetivos de las pruebas:
Hay normas de preparación de los usuarios para aplicar, evaluar e interpretar pruebas.
Las normas son más estrictas para las pruebas individuales que en las colectivas, en las de
inteligencia y personalidad que en las de rendimientos y aptitudes especiales.
- Nivel A: cuenta con al menos un curso terminado sobre medición o cuenta con experiencia
supervisada en aplicación e interpretación
-Nivel B: ha concluido con una capacitación graduada sobre medición, guía, evolución
individual o métodos de valoración adecuados para una prueba particular.
-Nivel C: ha terminado con un reconocimiento de un programa de capacitación con trabajo
apropiado y ha supervisado la experiencia práctica en la administración e interpretación de
instrumentos de evaluación.
Todos los usuarios deben respetar el código de ética: mantener la seguridad de los
materiales de evaluación antes y después de aplicar la prueba, mantener la confidencialidad de
resultados, evitar etiquetar a los individuos con base al resultado de una sola prueba, no
fotocopiar o reproducir cuadernillos de preguntas ni textos ni manuales, respetar la ley de
derecho de autor, aplicar y calificar las pruebas exactamente como dice el manual, entregar
resultados solamente a las personas autorizadas, realizar las pruebas en un contexto profesional
y por parte de especialistas capacitados, uso cuidadoso de calificación e interpretación de
pruebas, explicaciones claras y cuidadosas, antes de administrar la prueba explicar al evaluado
en que consiste la prueba y su objetivo.
Hay que garantizar que los resultados de las pruebas (muchas veces guardados en
formato electrónico) sean protegidos adecuadamente contra la revelación impropia. A menos
que la ley exija otra cosa, se necesita el consentimiento informado de quienes se someten a una
prueba o sus representantes legales antes de entregar los resultados identificados con el nombre
del examinado a cualquier persona o institución. El consentimiento informado implica que una
persona acepta se entregue información privada porque sabe en qué consiste esta y con quién
será compartida. Antes de que cualquier prueba u otros procedimientos psicológicos se
administren, debe comunicarse al examinado el carácter y los objetivos de la evaluación, porque
se está aplicando, quién tendrá acceso a la información y cómo se usará esta. Además de los
derechos de consentimiento informado y confidencialidad, deberá adjudicarse la etiqueta
“menos estigmatizante” al informar sobre la presencia de ciertos síntomas o trastornos.
-------------------------------------------------------------------------------------------------------------------
OBSERVACIONES
Es básica para todas las ciencias, implica advertir los hechos como se presentan en la
realidad y escribirlos, registrarlos para su posterior análisis. Los componentes de la observación
son: observador – fenómeno o hecho – información o datos que se buscan – modo de
participación del observador – instrumentos o métodos de observación.
Observaciones clínicas: Son dentro del contexto clínico. Éstas observaciones no son del
todo objetivas, porque la conducta está afectada. Por eso las observaciones e
interpretaciones deben ser verificadas por personas y procedimientos distintos. Un
observador clínico alerta advierte también las conductas no verbales.
--------------------------------------------------------------------------------------------------------------------
Según su finalidad:
Cuando el psicólogo se encuentra ante un paciente al que tiene que atender, sabe que al
final de todo proceso de evaluación va a tener que elaborar un informe mas o menos extenso en
el que tiene que expresar y hacerse entender, los diferentes aspectos encontrado, las
recomendaciones y el tratamiento mas efectivo. El informe es la ultima etapa de todo proceso
de evaluación. En el informe se debe analizar, sintetizar y relacionar todos los datos adquiridos
en la información previamente obtenida, se debe tener una habilidad propia del lenguaje para
hacerse entender con precisión y claridad.
Hay 4 factores comunes en todo informe psicológico: comunicado de forma oral o
escrita, presenta una síntesis de evaluación o diagnostico efectuado, indica el tratamiento más
adecuado o recomendaciones de actuación y da respuesta al motivo de consulta u objetivos
planteados. Es decir que el objetivo es dar respuesta a los interrogantes planteados por el sujeto
o remitente y está centrado en el mismo sujeto, no se debe dar más información que la necesaria
para la finalidad que fue solicitado.
Informe escrito
Basado en las técnicas (e hipótesis): Su valor tiende a ser casi nulo. El inconveniente
mayor es que presentan impersonalización del informe.
Puntos básicos que se deben incluir en el informe psicológico: datos de identificación, motivo
de la consulta, técnicas empleadas, conducta observada en el proceso, resultados obtenidos,
integración de resultados, y recomendaciones terapéuticas (adherir al enfoque salugénico:
siempre recomendar algo para que la persona esté mejor, como cosas extra-terapéuticas).
Como normal general, es necesario tener muy claro cuál es el objetivo del informe y dar
respuesta a los interrogantes planteados en el momento en que el sujeto fue requerido para la
evaluación. Cuando se tenga seguridad de datos confiables, seguros y definitivos, hay que darle
convicción presentándolos con toda confianza. La terminología que se debe emplear tiene que
ser tal que el destinatario pueda entender lo que se le quiere decir, es necesario por ende ajustar
la terminología y el lenguaje según el remitente.
--------------------------------------------------------------------------------------------------------------------
Antecedentes históricos
- Período mítico: aparece un interés del hombre por comprender, describir, categorizar, predecir
y explicar a las personas. La astrología y el horóscopo son la forma evaluativa más antigua y
permanente. Hay un objeto a evaluar y el evaluador predice el futuro según determinadas
categorías de una taxonomía previamente acordada.
Durante siglos XVIII y XIX, los avances de medicina y la influencia de corrientes filosóficas
como el empirismo y el positivismo ayudaron a la constitución de la psicología como disciplina
científica y a la evaluación.
- Siglo XIX: hallazgos de Weber continuados por Fechner. Se crea una nueva disciplina (la
psicofísica), que permite por primera vez medir un aspecto subjetivo (la sensación), a través del
autoinforme. Ninguno se preocupó por constatar diferencias individuales, pero sin embargo la
psicofísica contribuye a la actual psicometría, cuyo objeto es hallar tales diferencias.
Modelo: para comprender el concepto modelo se debe tener en cuenta los 3 sentidos principales
que utiliza: analógico, formal y aplicado.
- interaccional: se analizan las relaciones de interdependencia entre las variables, en busca de las
líneas de causalidad de la conducta
- multicontextual: se analizan las variables multi contextuales físicas, afectivas-emocionales,
creencias y valores, las exigencias contextuales y la variabilidad situacional y temporal entre
tales contextos.
Por esta necesidad de tomar en cuenta la inserción del sujeto en el contexto, se realiza
una triple distinción para analizar a continuación tres tipos de evaluación:
El análisis del ambiente es tan importante como lo es el del ambiente percibido, a la hora de
evaluar psicológicamente a un sujeto si deseamos tener en cuenta el contexto en su complejidad.
Existen 4 orientaciones teóricas que han sustentado los principales enfoques evaluativos
aplicables al análisis de contextos/situaciones /ambientes: la psicología ecológica, la ecología
social, el enfoque conductista-ecológica y el enfoque cognitivo-perceptivo.
TÉCNICAS PSICOMÉTRICAS: CONSTRUCCION Y ADAPTACION DE TEST PSI
- Nominal: números solo cumplen función simbólica que sirven para categorizar: ejemplo: 1=si
-De razones: diferenciación y ordenamiento jerárquico con cero absoluto, que indica la
ausencia del constructo. Ejemplo: ingresos del sujeto en LISRES
Prueba era el término usado para referirse a todo, desde la administración de una prueba
hasta la interpretación de la evaluación de la misma. Sin embargo para la época de Segunda
Guerra Mundial comenzó a surgir una distinción entre prueba y evaluación. Definiremos
prueba al “proceso de medir variables relacionadas con la psicología por medio de dispositivos
o procedimientos diseñados para obtener una muestra de comportamiento”. El test es un
“instrumento de evaluación cuantitativa de atributos psicológicos de un individuo”.
- para medir sujetos del mismo objeto de estudio pueden ser útiles diversos enfoques: es decir,
pueden variar pruebas y técnicas de medición para medir el mismo constructo.
- la evaluación puede señalar fenómenos que requieran una mayor atención o estudio.
- diversas fuentes de error son parte del proceso de evaluación. Las fuentes potenciales de error
son variadas.
- las pruebas y otras técnicas de medición tienen ventajas y desventajas. Esto implica conocer
las limitaciones de las pruebas y compensarlas con datos de otras fuentes.
- El que usa la prueba: si bien son usadas por variedad de profesionales, todos deberán cumplir
con los principios éticos correspondientes. El que administra la prueba tiene que estar
familiarizado con los materiales y procedimientos de la prueba y tener todos los materiales.
- El que responde la prueba: las personas evaluadas enfocan una situación de evaluación de
diferentes maneras y el administrador debe ser sensible a la diversidad de respuestas posibles
ante una situación de prueba.
- Otros contextos
- Teoría clásica de las pruebas o test: Los términos claves de esta teoría son: puntuación
observada (O), puntuación verdadera (V) y puntuación de error (E).
El puntaje que obtiene una persona en una determinada prueba incluye el puntaje real de dicha
persona y un margen de error que puede aumentar o puede disminuir la puntuación verdadera.
La TCP tiene algunas limitaciones: el éxito de las técnicas depende de qué tan parecida
es la población con la cual se obtuvieron los índices respecto de la población a la que se la
pretende aplicar. Otro problema es que es centrada en el test mas que en el reactivo.
- Teoría de la generalizabilidad: Según esta teoría, las diversas mediciones del mismo
individuo pueden variar tanto por efecto de una variación en lo que se mide como por el error de
medición. Estudia simultáneamente muchas fuentes de inestabilidad o error. La TG empieza con
la misma noción básica de la TCP, es decir, que cada persona tiene una puntuación verdadera,
que denomina “puntuación universal” o “puntuación de dominio”. Esta puntuación es la
promedio a lo largo de todas las ocasiones, formas y calificadores.
- las características de los reactivos no dependen del grupo del cual fueron obtenidos
- los puntajes que describen la habilidad de los examinados no dependen del test en su conjunto
- el modelo se expresa a nivel del reactivo más que a nivel del test
--------------------------------------------------------------------------------------------------------------------
CONSTRUCCIÓN
- Definición del objetivo: se establece cuál o cuáles serán los objetivos que se evaluarán a través
de la prueba (por ejemplo: la habilidad de comprensión, que incluye respuestas que se refieren
únicamente a una comprensión de los mensajes literales contenidos en la comunicación)
- Descripción del objetivo: se define en términos de conductas observables el o los objetivos a
ser evaluados (por ejemplo: se especificaría un objetivo de la habilidad de compresión tal como
“ser capaz de analizar el propósito del autor y POV examinando una comunicación escrita”)
- Especificación de las características de la situación de evaluación: aquí se especifican todos
aquellos aspectos a tener en cuenta en la situación de evaluación (por ejemplo: en un texto de
divulgación científica, marcar párrafo e identificar oración donde se expresa intención del autor)
- Características de la respuesta: se especifica cual es la respuesta que se espera del sujeto
Redacción de ítems: Existen pautas convencionales para la redacción de ítems de prueba. Estas
incluyen recomendaciones tales como: redactar ítems congruentes con el objetivo de medición y
evitar los ítems demasiado largos, las oraciones complejas con ambigüedades de sentido, las
frases con dobles negaciones, el uso de expresiones extremas (nunca, todos, siempre) y utilizar
el lenguaje más apropiado al nivel de maduración y educativo de la población. Los dos errores
mas comunes son: ambigüedad (preguntas difusas que admites varias respuestas) y trivalidad
(centrarse en aspectos poco importantes del rasgo o dominio en cuestión). Existe el formato de
construcción de respuesta o de selección de respuesta.
Revisión del test por expertos: La mayoría de los autores recomiendan que los ítems
preliminares de un test sean revisados por expertos en construcción de pruebas, en el dominio o
rasgo a medir y en el nivel de comprensión de la población a la cual se apunta con la prueba.
Análisis y selección de ítems: Existen varios procedimientos de análisis de los ítems de una
prueba preliminar, que se ocupan de la distribución de los puntajes en cada ítem y de la relación
estadística entre el ítem y la prueba total. El primer paso para obtener información psicométrica
sobre los ítems de pruebas homogéneas consiste en administrar los elementos preliminares a una
muestra amplia representativa de la población que se quiere evaluar en la prueba final. Para
descartar ítems que no funcionan bien debe contarse con una cantidad de sujetos cinco veces
superior al numero inicial de reactivos y el doble de ítems de los que aparecerán en la versión
definitiva. Una vez aplicada la prueba piloto se podrán tomar decisiones sobre cuales de los
ítems deberán integrarse a la forma final del test. El objetivo es que todos los reactivos se
relacionen con un núcleo común de medición que es el constructo o dominio. El análisis
factorial es un método para agrupar las variables que se correlacionan fuertemente entre sí y
cuyas correlaciones con las variables de otros agrupamientos es menor. Antes de realizar un
análisis factorial debe determinarse si los ítems están suficientemente interrelacionados.
ADAPTACIÓN
- Traducción inversa: el más utilizado, donde un grupo de traductores realiza una traducción
desde el idioma original al nuevo idioma, luego un segundo grupo toma el test traducido y lo
vuelven a traducir al idioma original. Se realizan comparaciones entre las dos versiones.
Métodos para establecer la equivalencia entre test: una vez realizada la traducción se debe
realizar el estudio para establecer si esa traducción es equivalente a la original. 3 métodos:
- Administración de la prueba en el idioma original y de la prueba traducida a sujetos
bilingües: se aplica ambas versiones de las prueba a sujetos que hablan ambos idiomas. La
ventaja es que se pueden controlar las diferencias de las características de los participantes en el
test ya que ambas pruebas se administran a las mismas personas. La desventaja es que se basa
en la premisa de que los sujetos son igualmente competentes en ambos idiomas
Contexto: Los efectos de las diferencias culturales que no sean relevantes para los objetivos
centrales del estudio, deberían minimizarse en la medida de lo posible. Debería de evaluarse la
cuantía del solapamiento de los constructos en las poblaciones de interés.
--------------------------------------------------------------------------------------------------------------------
2) Aspectos de diseño preliminares: tomar decisiones sobre el diseño del instrumento. Deben
abordarse los siguientes aspectos del diseño:
- Modo de aplicación: se aplicara de forma individual o grupal, la colectiva será mas eficaz pero
la individual permite mas adaptabilidad en los formatos de los reactivos y la observación clínica
- Duración: ¿cuánto durara la prueba? ¿será breve? ¿con qué período de aplicación? Una breve
es más eficaz, pero tendrá menos confiabilidad que una extensa
- Informes de las puntuaciones: ¿qué clase de reportes de puntuaciones se producirán? ¿se hará
un registro simple escrito a mano o un conjunto elaborado de informes? ¿Se informará
solamente el puntaje total de la prueba o el desempeño en conjuntos de reactivos?
La redacción de los reactivos no debe iniciarse hasta que estas consideraciones de diseño
preliminares hayan sido exploradas al detalle. Estas condiciones declararan que clase y cantidad
de reactivos se redactarán. Las deliberaciones sobre estos aspectos de diseño preliminares
pueden conducir a una depuración en el planteamiento de la finalidad de la prueba.
- necesidad práctica
- necesidad teórica
- revisar o adaptar las pruebas existentes: la idea es conservar lo más posible la estructura
fundamental del instrumento, pero con una modificación para poblaciones especiales
Consideraciones para redactar los reactivos: Una regla práctica consiste en preparar 2 o 3 veces
más reactivos de los necesarios para la prueba final. Deben tener claridad semántica, adecuación
al nivel madurativo y educativo de la población, utilizar la cantidad suficiente de reactivos, etc.
Edición y revisión de los reactivos: Una vez redactados los reactivos, se someten a una revisión
desde varias perspectivas. Primero se revisan en función de su claridad, corrección gramatical y
conformidad con las reglas para la redacción de reactivos. En segundo lugar se hace una
revisión de la corrección de contenido. Y en tercer lugar se revisan en busca de posibles sesgos
de género, raciales, étnicos, etc. Luego son revisados por jueces especializados y se evalúa la
validez de contenido, permite saber si los ítems representan al constructo.
- condiciones que rigen la respuesta: se hallan variables como el límite de tiempo para responder
o si quien aplica la prueba puede sondear las respuestas ambiguas y cómo se registra.
- el procedimiento para calificar: por ejemplo si es opción múltiple podría calificarse como
correcto o incorrecto, o que se de crédito parcial por elegir ciertas opciones (por ejemplo, en el
WAIS si se ofrece buena respuesta es 2 sino 1 o 0).
4) Análisis de los reactivos: etapa crucial que conlleva el análisis de datos obtenidos al someter
a prueba los reactivos. Los reactivos se eligen para su inclusión en la prueba final con base en
este análisis, el cual consiste en 3 procesos:
- Prueba de reactivos: una etapa formal y otra informal. Los datos del análisis de reactivos se
basan en la prueba formal. Sin embargo antes de realizar esta, se lleva a cabo una prueba
informal de los reactivos del instrumento. Esta aplicación informal se le pide a los individuos
que comenten los reactivos y las instrucciones o que piensen en voz alta, así el creador puede
identificar formulaciones ambiguas, interpretaciones inesperadas de un reactivo, confusión
sobre métodos de respuesta, etc. La prueba formal supone aplicar los nuevos reactivos de la
prueba a muestras de examinados que sean representativas de la población meta del
instrumento.
- Análisis de distractores: se eliminan ítems que no son claros (aquellas opciones que son
incorrectas o menos preferidas a la hora de elegir una respuesta)
Hay 3 tipos de programas de equivalencia que podrían realizarse como parte o al mismo
tiempo que el programa de estandarización:
1- Si la prueba tiene formas alternas, para que las normas se apliquen a todas las formas, éstas
deben corresponderse.
a- Indican la posición del individuo en relación con la muestra normativa, lo que permite
la evaluación de su desempeño.
b- Si se expresan en la misma unidad, proporcionan medidas equivalentes que permiten la
comparación directa del desempeño del individuo en pruebas diferentes, para comparar
funciones diferentes. No resulta así con las puntuaciones crudas, porque se expresan en
unidades diferentes o se influye por el nivel de dificultad de la prueba.
Las puntuaciones derivadas se expresan en: Nivel de desarrollo alcanzado // Posición relativa
dentro de un grupo específico.
- Normas de edad mental: Edad basal (mayor edad en la que todas las pruebas eran pasadas por
los sujetos) + meses adquiridos como créditos en los niveles superiores. No es constante con la
edad: tiende a disminuir con los años. Las puntuaciones se agrupan cronológicamente.
Puntuación de un niño: mayor nivel que ha alcanzado con éxito; o por el número total de
aciertos o de errores. Promedio de puntuaciones de los niños: norma de edad de esa prueba.
- Normas de grado: Puntuación promedio de los niños de cada grado. Hay grados intermedios
también. Tienen varios defectos:
- Contenido de la instrucción varía de grado a grado; por eso sólo sirve para las materias
enseñadas en común en todos los grados y no son aplicables a los años donde hay materias que
se dan sólo en algún grado, como es en la secundaria.
- Pueden ser malinterpretadas (a menos en que se sepa siempre de dónde derivó los resultados).
- Tienden a ser consideradas de forma errónea como criterios de desempeño, en vez de
considerar también las diferencias individuales entre los sujetos del grado.
Comparaciones entre pruebas: los resultados de ellas no pueden interpretarse en abstracto, sino
que tienen que ser referidos a pruebas particulares y a su posición en otras pruebas. Tenés que
fijarte que las normas de las pruebas sean comparables antes de realizar las comparaciones del
mismo sujeto y su posición relativa en ellas. Además tenés que fijarte en qué se igualan los
instrumentos para abarcar con eso la comparación. El contenido, las unidades de escala y la
composición de las muestras de estandarización de cada una de las pruebas puede diferir y en
ese caso no se puede realizar una comparación.
Normas locales: en ambientes particulares surgen y los grupos empleados para derivar dichas
normas son definidos de una forma más limitada que los subgrupos.
Grupo fijo de referencia: se usa en escalas no normativas. Gracias a este grupo se asegura la
comparabilidad y continuidad de las calificaciones sin brindar una evaluación normativa del
desempeño. Se emplean normas específicas, especialmente las locales. Importante: mantener la
escala constante en su forma y aplicación y disponer de datos normativos complementarios para
ayudar a la interpretación y toma de decisiones.
CONFIABILIDAD Y VALIDEZ
Test-re test: se obtiene aplicando la misma prueba a los mismos individuos en dos ocasiones
diferentes. El coeficiente de confiabilidad es la correlación. Si la correlación entre los resultados
de las diferentes aplicaciones es altamente positiva, el instrumento es confiable. Evalúa los
cambios en las condiciones personales, condiciones en las aplicaciones y condiciones en los
calificadores dependiendo si la prueba califica la misma persona o proceso. Desventajas: no
evalúa los cambios en el contenido de la prueba, porque siempre es la misma que se aplica.
Preocupa el efecto de la primera prueba en la segunda, quizá el examinado recuerde la primera y
de las mismas respuestas en la segunda ocasión, o también puede equivocarse en la primera y
resolverlo en los días intermedios y así contestarlo bien en el segundo. El intervalo debe ser lo
suficientemente largo para que la primera prueba ejerza una influencia mínima en la segunda,
pero no debe ser tan largo que el rasgo medido pueda sufrir un cambio verdadero entre ambas.
Confiabilidad de la forma alterna o paralela o equivalente: exige que haya dos formas de la
prueba que deben ser iguales o similares en la cantidad de reactivos, limites de tiempo,
contenido, etc. Se deben aplicar ambas formas de la prueba a los mismos examinados y sacar un
coeficiente de correlación entre las puntuaciones obtenidas de las dos formas. Se pueden aplicar
en sucesión inmediata ambas pruebas si son breves y poco exigentes, sino se puede dejar un
tiempo estipulado entre cada aplicación de las formas. Si se deja ese tiempo no solo se medirá
las variaciones en el contenido sino también en las condiciones personales y de aplicación. No
se utiliza mucho ya que son pocas las pruebas que cuentan con formas alternas, además reduce
pero no elimina el efecto de la práctica y lleva tiempo.
Consistencia interna: se utiliza cuando no interesa cuanto han cambiado los sujetos en el
tiempo, sino en saber si los ítems o las partes del cuestionario responden a las mismas
especificaciones y si los ítems son representativos del constructo a estudiar. Es imprescindible
que todas las partes del cuestionario representen al mismo dominio de contenido, además de que
los ítems estén bien construidos. Hay distintos métodos de medir la consistencia interna:
- División por mitades: se realiza la aplicación de una sola prueba pero se califica a la misma
por dos mitades, como si cada mitad fuera una forma alterna de la prueba. Luego se
correlacionan los puntajes de ambas partes. Si el instrumento es confiable, las puntuaciones de
ambas mitades deben estar fuertemente correlacionadas. Un individuo con baja puntuación en
una mitad, tendrá que tener también baja la puntuación en la otra mitad. Normalmente la prueba
no se divide exactamente en una primera y segunda mitad, ya que en la segunda mitad los
reactivos son mas difíciles y los examinados pueden estar mas cansados al llegar a estas, además
la mera correlación entre las dos partes no da la confiabilidad de la prueba entera. Para esto la
confiabilidad non-par es una forma de medir el instrumento el dos partes teniendo en cuenta lo
anterior, se toman los reactivos pares por un lado y los impares por el otro.
Error en el estándar de medición: el error estándar de medición tiene una relación inversa con
la confiabilidad. Un instrumento altamente confiable, tiene un nivel de error pequeño. Un
instrumento con confiabilidad baja, mide su objeto con un alto índice de error. Por lo tanto, el
mayor índice de error de medición, menor confiabilidad, y viceversa. Es la diferencia de las
puntuaciones observadas con respecto a las puntuaciones verdaderas de las personas.
-Error constante: es aquel que genera una puntuación sistemáticamente elevada o baja en una
persona al margen de la constancia que haya en la persona en el rasgo medido. Estos errores son
aleatorios, constantes y no sistematizados que no afectan a la confiabilidad (por ejemplo: si a
niño de lengua materna español se le evalúa ingles obtendrá un puntaje inferior a sus
capacidades de forma constante). Puede afectar a todas las observaciones por igual y ser un
error constante, o afectar a cierto tipo de observaciones, y ser un sesgo. Es difícil predecir y
controlar ya que está relacionado a factores casuales. Se suele decir que son tendencias que
desplazan las puntuaciones en una determinada dirección.
- Error no sistemático: estos sí son los errores que dan problemas de confiabilidad. Las
principales fuentes de error son:
. Calificación de prueba: surge de la falta de acuerdo entre calificadores en los criterios para
calificar las puntuaciones de las personas en las pruebas. Cuanto más juicio (deliberación,
pensar sobre ello, cuanto más subjetivo) exija la calificación, más será posible la falta de
confiabilidad. Para que esto no suceda se debe contar con criterios de calificación claros y
explícitos a fin de que se reduzca al mínimo las variaciones entre calificaciones.
. Contenido de la prueba: las variaciones del muestreo de los reactivos de una prueba pueden
generar un error no sistemático en las puntuaciones. Las puntuaciones aumentan o disminuyen
no por diferencias reales sino por cambios aleatorios en el conjunto de los reactivos que se
presentan a la prueba (por ejemplo: de 6 temas, un alumno estudia los primeros 3 y el otro
alumno estudia los otros 3; la profesora pregunta sobre los primeros 4 temas, los dos estudiaron
la misma cantidad de temas pero al primero le va mejor).
. Aplicación de una prueba: se da por las variaciones de las aplicaciones, por ejemplo en cómo
se da la instrucción, los límites de tiempo, la luz, el ruido o las disposiciones físicas. Para esto,
la prueba debe contar con procedimientos estandarizados de aplicación donde deban ser
controladas todas las variables contaminantes.
. Condiciones personales: las condiciones de las personas varían de un día a otro. Pero las
variaciones en estos factores no generan automáticamente inestabilidad o falta de confiabilidad
--------------------------------------------------------------------------------------------------------------------
La nueva concepción de la validez supone que la misma no es una propiedad del test sino más
bien del significado de las puntuaciones de los test.
El termino subrepresentación del constructo alude a que una prueba no capta aspectos
importantes del constructo, y la varianza irrelevante se refiere a la influencia de procesos ajenos
al constructo que ejerce en la puntuación de la prueba.
El aspecto básico consiste en ofrecer evidencia de que las puntuaciones en una prueba son
indicadores del rasgo o constructo de interés. La validez es la característica aislada mas
importante de una prueba, es la consideración fundamental al desarrollar y evaluar pruebas.
Tipo de validez:
Validez aparente: la prueba “parece” medir su constructo meta. Nunca sustituirá la validez
empírica, no es posible tan solo ver una prueba y saber su grado de validez. Esto se utiliza en el
caso de que dos pruebas contengan una validez establecida en forma empírica, es preferible
utilizar la que tiene mejor validez aparente.
Validez de contenido: pone el acento en el contenido que los compone, en qué medida reflejan
el constructo. Tiene que ver con la relación entre el contenido de una prueba y cierto campo de
conocimiento o comportamiento definido. Debe haber una correspondencia entre el contenido
de la prueba y el del campo de interés. Supone la noción de muestreo, el contenido de la prueba
ha de medir una muestra representativa del área de la conducta que debe medir, es decir que
abarca una muestra representativa de todos los posibles contenidos del campo.
El método para corroborar esta validez es el análisis sistemático de los contenidos de la prueba a
través de diferentes jueces (varias personas puntúan y se correlacionan) o también se pueden
comparar los resultados con otra prueba validada para saber si correlacionan los resultados.
Obtener una especificación clara del campo de contenido resulta difícil, y por otro lado otra
dificultad que suele aparecer es al juzgar qué tan bien los reactivos de la prueba cubren los
elementos de las especificaciones de contenido.
- criterio externo: criterio externo que ofrece una definición realista del constructo de interés,
define lo que en específico se quiere conocer. El coeficiente de validez es la correlación entre
los criterios.
- grupos de contraste: se quiere demostrar que la prueba diferencia a un grupo de otro, cuanto
mejor sea la diferenciación entre grupos más valida será la prueba.
- correlación con otras pruebas: se utiliza cuando es probable que la nueva tenga mejores
normas o procedimientos de calificación más eficaces.
También dos conceptos a tener en cuenta en la validez de criterio son validez convergente y
validez discriminante:
- validez convergente: correlación entre la prueba y algún criterio que se considera que mide el
mismo constructo de la prueba. Una misma dirección entre la prueba y el recurso utilizado, hay
convergencia entre ambos, una correlación alta.
- validez discriminante: la prueba cuenta con una correlación relativamente baja con constructos
distintos al que se intenta medir. Cuando se busca correlacionar el instrumento con una prueba
en la que creemos que los constructos dos diferentes.
- Matriz multirasgo: pruebas que poseen distintos rasgos, por lo tanto se espera que en todas las
dimensiones o rasgos se encuentre validez discriminante.
Validez de constructo: se refiere al grado en que puede afirmarse que se mide el constructo o
rasgo teórico. Centra su atención en la función que cumple la teoría psicológica en la
elaboración de la prueba y en la necesidad de formular hipótesis que puedan ser comprobadas o
refutadas en el proceso de validación, para lo cual requiere la acumulación de diversas fuentes
de información. Los métodos para corroborar esta validez son:
- Análisis factorial: se evalúa la correlación de los ítems con las dimensiones de la definición
del constructo a estudiar. Forma de cotejar que los ítems del test se relacionen con el constructo
y la teoría. Se utiliza como herramienta la estadística. Remite a reducir un numero de variables,
ordenar los distintos ítems en distintos factores. Su cantidad puede ser libre o regulada por el
experimentador, y se tienen que relacionar con las dimensiones teóricas de las que se parte en la
conformación del instrumento.
- Correlación c/ otras pruebas: se correlaciona la técnica c/ otra prueba que mida el constructo.
Validez de la prueba y teoría de la decisión: una característica de la teoría de decisión es que las
pruebas se evalúan en términos de su eficacia en una situación particular. La evaluación no
solamente toma en consideración la validez de la prueba para predecir un criterio particular,
sino también otros parámetros como la tasa base y la razón de selección. La teoría de la decisión
no introduce al proceso de decisión el problema de los valores. Los sistemas de valores siempre
han estado presentes en las decisiones. La teoría de la decisión ha permitido centrar la atención
en la complejidad de los factores que determinan la contribución de determinado instrumento a
una situación particular. El coeficiente de validez por sí mismo no puede indicar si se debe usar
o no una prueba, ya que solo uno de sus factores puede ser considerados al evaluar el impacto
de la prueba sobre la eficacia del proceso total de la toma de decisiones.
EVALUACIÓN PSICOLÓGICA INFANTIL
c) En tercer lugar, el sujeto de la evaluación, por sus propias características de edad, ofrece una
serie de dificultades intrínsecas al proceso de evaluación: por ejemplo, sus posibilidades de
cooperación pueden verse limitadas, en mayor o menor grado, por las características evolutivas
(además de idiográficas) de su propia actividad verbal, motora, congnoscitiva, de su grado de
conciencia; en suma, de su edad cronológica; la distractibilidad y la variabilidad que
caracterizan sus actuaciones (especialmente en las edades de preescolar) obliga a matizar y/o
variar la planificación de las exploraciones psicológicas.
Messick (1983) presenta una visión algo distinta a la que aquí se expone. En su opinión
se han exagerado aspectos distintivos de la evaluación psicológica infantil, apelando a
problemas que ya están resueltos, bien sea por la técnica de elaboración y aplicación de pruebas
psicológicas, bien por la experiencia del evaluador. Por ende, sostiene que se debe proceder a la
elaboración de técnicas psicométricas pertinentes que incorporen el análisis del cambio. El
evaluador de niños y de adolescentes precisa de una específica preparación y de una experiencia
profesional pluridisciplinar que incluya conocimientos evolutivos, psicopatológicos, de
tratamiento, etc, y que debe estar dotado de una gran sensibilidad diagnóstica para apreciar, en
el proceso de evaluación, las distorsiones o variabilidades que puedan darse vinculadas a
factores de edad, factores socioculturales, fenómenos educativos, situaciones específicas y que
deban ser interpretadas con valor diagnóstico propio o accidental.
Debe además tenerse en cuenta que algunos intervalos de edades parecen mostrar más
estabilidad que otros, de modo que la irregularidad en el ritmo de evolución toma valores
diagnósticos distintos según edades, y en función de las variables o constructos contemplados.
En los estudios de evaluación psicológica infantil se han considerado tres tipos de cambio o
diferencias a lo largo del tiempo:
1) Análisis del propio niño “como contexto”, ya que la parcialización del individuo (tanto como
la de separarlo de sus contextos) con finalidades diagnósticas conduce a introducir un gran
sesgo en la evaluación.
2) Análisis del contexto que envuelve al niño, donde Messick estudia dos tipos concretos: los
microcontextos (familia, barrio, escuela, aula) y los macrocontextos (contextos escolares,
medios de comunicación, ambiente sociocultural, etc).
En las consultas de evaluación psicológica infantil hay que atender a varios cambios
simultáneos: el producido por el propio desarrollo, el creado por los sistemas de formación
(escuela) y el planificado a partir de la consulta psicológica.
MODELOS EN EVALUACIÓN PSICOLÓGICA
CENTRADOS EN LA PERSONA
Ámbito: clínico
Formulación teórica: C = f (O) la conducta en función del organismo (a diferencia del modelo
médico, la O se refiera a un constructo intrapsíquico). Se utiliza el método inductivo.
Objeto de estudio: procesos y contenidos inconscientes para conocer su dinámica
Objetivo: ayudar al cambio terapéutico, restando importancia a la clasificación nosológica
Ámbito: clínico
Objeto de estudio: La experiencia subjetiva del individuo y el significado que éste le atribuye a
los eventos de la realidad.
Objetivo: No interesa evaluar lo que la persona es, sino que potencial tiene para llegar a ser.
Los objetivos son descripción, clasificación, predicción, explicación y modificación de la C.
Técnica: entrevista libre no estructurada, autoevaluación como procesos consciente.
CENTRADOS EN LA SITUACIÓN:
Técnica: observación directa de la conducta en su medio natural, así como el registro con
posterior análisis de las verbalizaciones.
1) MODELO PIAGETIANO: Piaget elaboró una teoría estructuralista que postula que en el
desarrollo se producen cambios sistemáticos que suponen una reorganización de
conocimientos previamente disponibles, basándose en que el sujeto es activo en la
construcción de su realidad.
Objetivo: identificación cualitativa de un sujeto al determinar el actual nivel de funcionamiento
cognitivo o estadio en el que se ubica, y así predecir sus posibilidades sus posibilidades de
resolver determinados problemas.
Ténica: la observación
Ámbito: educativo. Precursor de los modelos interaccionales.
4) MODELO ECOLÓGICO:
Formulación teórica: C x f (PxA), es decir la conducta en función del sujeto y del ambiente, en
influencia mutua.
Objetivo: conocer la forma en que el sujeto maneja las demandas del ambiente, su influencia,
etc. Y la manera en que actúa sobre el ambiente.
Objeto: la relación recíproca entre variables personales y contextuales.