Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Teoría Clásica de los Tests: describe la influencia de los errores de medida en las
puntuaciones que se obtienen a través de instrumentos. Problema de la incertidumbre o
error inherente a las medidas realizadas mediante la aplicación de un test. Para medir en
Psicología es necesario asumir dos supuestos:
- existen puntajes verdaderos, que reflejan la realidad, miden de un modo exacto, sin
error. Supuesto ideal, H de trabajo. Se supone la existencia de puntuaciones verdaderas,
sin error. Puntaje teorizado, ideal. Puntaje verdadero.
- siempre que se realizan mediciones pueden cometerse errores. Se supone que al
realizar una medición del fenómeno lo más probable es que se cometan errores. Puntaje
concreto, resultado de la aplicación de una técnica. Puntaje obtenido.
X = Xv - Xe
1
Xv = X - Xe
X = puntaje obtenido
Xv= puntaje verdadero, hipotetizado, ideal
Xe = puntaje debido al error
Confiabilidad: PV + PO +- e
Tipos de error
Tipos de error que generan las mediciones:
- sistemático de construcción del instrumento. Afecta la validez
- asistemáticos o de medición. Afecta la confiabilidad
- sesgo. Afecta la validez.
Error sistemático o constante: las fuentes de error sistemático son las que desplazan las
puntuaciones en cierta dirección, generando una puntuación sistemáticamente alta o
baja. A pesar de introducir diferencias en el resultado de la medición no cambia la
variabilidad, la distribución de las puntuaciones de los sujetos en la variable que se está
evaluando. Se detectan a través del análisis de la validez.
Ej.: balanza que indica 1,5 kg de más. Si se evalúa con esta balanza a una muestra de S,
todos verán su peso aumentado en 1,5 kg., pero su peso relativo permanece sin cambios
(la diferencia de peso entre los S). El Kg y medio de más es una constante que se suma
al valor verdadero de cada medición.
Test que sistemáticamente sobrevalore o subvalore el nivel del inteligencia de los S, o el
nivel de depresión.
Error en el instrumento (no se entiende la consigna por ej.). Afecta a las respuestas.
Afecta a todos los que responden, a toda la población potencialmente evaluada.
2
Las fuentes de error pueden haber sido generadas durante la etapa de construcción del
instrumento, en la administración, en la puntuación o en la interpretación de los
resultados.
Sesgo
No afecta a todos los S, sino a un pequeño subgrupo de la población. Por razones ajenas
a la variable evaluada. Materiales culturalmente no pertinentes para el subgrupo
poblacional. También es sistemático (siempre perjudica o favorece al S). también afecta
la validez.
Conceptos estadísticos
Varianza y desvío estándar: usados para estudiar la dispersión o variabilidad de los
puntajes obtenidos. Siempre que se aplica un instrumento de medición a un grupo de
personas, se obtiene una distribución resultante (los individuos asumen diferentes
valores de la variable)
Desvío estándar (s): cuán dispersos están los puntajes brutos respecto de la media. Si el
s es muy pequeño, la muestra está agrupada alrededor de la media. Si es elevado, los PB
están alejados respecto de la media.
Raíz cuadrada de la varianza.
S2 = Sv2 + Se2
3
Se2: varianza debida al error. Cualquier condición que sea irrelevante para el propósito
de la prueba. Discrepancias entre los datos obtenidos por en la primera medición y en la
segunda.
Coeficiente de confiabilidad
Coeficiente de confiabilidad: índice de confianza en las puntuaciones. Informa el
grado de precisión del instrumento. Número que indica en qué medida una técnica es
confiable. Permite conocer el error que se comete al realizar una medida.
Varianza verdadera
Coeficiente de confiabilidad: ______________________
Varianza total
Sv2
Cxx = ____________
S2
Dificultad: el único dato para calcular el ccn es la varianza total, porque la verdadera y
la de error son incógnitas. Por lo tanto, la forma de calcular la confiabilidad es teórica, y
al coeficiente obtenido se lo llama coeficiente de confiabilidad teórico. Por lo tanto la
4
confiabilidad debe hallarse por otro camino, a través de métodos empíricos, y no con la
aplicación directa de la fórmula.
En todos los procedimientos hay que disponer de medidas paralelas de los mismos S
para luego calcular entre ellas el ccn.
Analizar la variabilidad de las puntuaciones obtenidas por una muestra de S. Analizar la
dispersión de los puntajes que arroja la técnica administrada a un grupo de personas.
El cc más usado es el de Pearson: medida que indica el grado de relación que existe
entre dos conjuntos de datos, provenientes de dos variables. Rxy (x e y simbolizan las
variables). En el caso de la confiabilidad, los dos conjuntos de datos provienen de la
misma variable. Por lo tanto el cc de Pearson sirve para calcular la correlación entre un
conjunto de datos provenientes de una primera medición y de una segunda, siendo la
5
misma variable la que se evalúa en las dos ocasiones. El cc de correlación acá indica la
consistencia entre los puntajes obtenidos en las dos mediciones.
Cuanto más cercano a 1 sea el cc, más parecido es el primer conjunto de medidas al
segundo (hubo menos errores que modificaran los resultados). Instrumento confiable.
Cuanto más cercano a 0, más discrepancia hay entre las dos mediciones (hubo más
errores, el error afecta en gran medida al instrumento). Instrumento menos confiable.
Cc de Pearson: vale 0 cuando hay total discrepancia y 1 cuando hay total concordancia
entre los dos conjuntos de medidas.
Cuanto más se acerca a 1 el ccn, menos contaminada de error está la prueba.
Cc de Pearson cuando se usa una sola variable: rxx. Cc de Perason y Coeficiente de
Confiabilidad se usan como sinónimos.
(Una técnica nunca puede tener un ccn igual a 1, porque siempre hay error al medir).
Test- retest
Para medir si el cambio de las puntuaciones se debe a falta de confiabilidad de la
prueba, a la falta de estabilidad de las puntuaciones o a un cambio real en la variable.
Este método identifica la fuente de error debida a las fluctuaciones temporales (que
influyen en las condiciones de la administración y en las condiciones del examinado).
Para ver si se elige este método hay que saber si la variable varía mucho o poco en el
tiempo (ej.: si se trata de evaluación de intereses, éstos son muy inestables en la niñez y
después se estabilizan).
Dificultad: si se evalúa con el mismo instrumento en dos momentos diferentes pueden
influir factores como la experiencia previa, la memoria, la falta de motivación, y por eso
la segunda aplicación ya no conserva las mismas características que la primera.
Distinguir entre los cambios en las puntuaciones debidos a cambios de la variable o los
cambios debidos a las fuentes de error inherentes al instrumento de medición.
Ej.: Koppitz usa el test-retest para el Bender. Pero advierte que un retest inmediato
mostraría los resultados de la práctica, mientras que un intervalo demasiado largo
reflejaría el efecto de la maduración. Por lo tanto el intervalo no debe ser ni muy largo
ni muy corto.
No se puede hacer si la variable es muy inestable (ej. estado de ánimo) o si hacerlo una
segunda vez implica aprendizaje.
6
Formas paralelas con intervalo
Se usa cuando se necesita minimizar el efecto de la memoria del contenido de otra
prueba aplicada con anterioridad. O sea, cuando no se puede aplicar el test-retest por el
efecto que el aprendizaje y la memoria tendrían sobre los resultados de la segunda
administración.
Se elabora una forma equivalente de la prueba y se la aplica a los mismos S en dos
oportunidades, con un intervalo de tiempo entre las dos.
Las formas paralelas deben ser similares en contenido, instrucciones y duración, en el
tipo de ítems, etc.
Controla dos fuentes de falta de confiabilidad:
- fluctuaciones temporales aleatorias (como el test-retest)
- inconsistencia de las respuestas a diferentes muestras de ítems.
Etapas:
1) Administrar una forma de test a una muestra de S.
2) Lapso de tiempo.
3) Administrar la forma paralela del test a la misma muestra.
4) Calcular la correlación (r) entre las puntuaciones obtenidas con cada una de las
formas.
5) Interpretar el coeficiente hallado (estabilidad temporal de las puntuaciones y
muestreo de contenido).
Etapas:
1) Aplicar a técnica a una muestra de S.
2) Dividir el conjunto de ítems en dos mitades homogéneas.
3) Calcular la correlación (r) entre los puntajes de cada una de las mitades.
4) Ajustar la confiabilidad de la prueba usando la fórmula Spearman- Brown (es la
que se usa cuando el instrumento se acortó o alargó).
5) Interpretar el coeficiente hallado (consistencia de las respuestas a lo largo del
test).
7
Ej.: Con el Bender no se puede hacer porque no hay número par de ítems.
Con el WISC se puede al interior de algunos subtests, no en el WISC completo
porque no es homogéneo, mide diversos atributos.
Etapas:
1) Aplicar las dos formas a una muestra de S (sin intervalo de tiempo entre ambas).
2) Calcular la correlación (r) entre las puntuaciones obtenidas por la misma
muestra en una u otra forma.
3) Interpretar el coeficiente hallado (consistencia de las puntuaciones).
Tener en cuenta que las aplicaciones de las dos formas pueden ser afectadas por la
fatiga y/o la falta de motivación de los S. Además se debe contemplar que puede haber
diferencias debido al orden de aparición de cada forma.
Etapas:
1) Aplicar y evaluar la técnica a una muestra de S.
2) Calcular el coeficiente KR-20 entre los ítems.
3) Interpretar el coeficiente hallado (consistencia, homogeneidad).
Etapas:
1) Aplicar la técnica a una muestra de S.
2) Calcular el coeficiente alfa entre las puntuaciones obtenidas en los distintos
ítems.
8
3) Interpretar el coeficiente hallado.
Etapas:
1) Administrar la técnica a una muestra de S.
2) Evaluar las técnicas administradas (evaluador A)
3) Evaluar las técnicas administradas (evaluador B)
4) Calcular la correlación (r) entre los puntajes asignados por el evaluador A y por
el evaluador B.
5) Interpretar el coeficiente hallado.
Ej.: subtest de vocabulario del WISC-III: se administró a una muestra de S. luego los
resultados fueron evaluados por cuatro examinadores y se calculó la correlación entre
los puntajes asignados por todos.
Técnica Evalúa
Test- retest Estabilidad temporal
Formas paralelas con intervalo Estabilidad temporal + consistencia
División por mitades Consistencia
Formas paralelas sin intervalo Consistencia
Coeficiente alfa Consistencia
Confiabilidad entre evaluadores Criterios de evaluación