Sei sulla pagina 1di 34

VALIDEZ Y CONFIABILIDAD

Tcnicas Psicomtricas

PROPIEDADES
PSICOMTRICAS- Estndares Tcnicos

VALIDEZ

CONFIABILIDAD

Se refiere a lo que mide una

Se relaciona con la

prueba y no puede expresarse en

consistencia de la medicin,

general sino que debe consignarse

al margen de que lo mida exactamente

el uso particular para el que se

Una prueba es confiable si es

planea utilizar el instrumento

consistente y precisa

MIDE LA PRUEBA
EL CONSTRUCTO QUE

LA PRUEBA FUNCIONA
DE MANERA SIMILAR o CONSTANTE
BAJO DIFERENTES
CONDICIONES o CIRCUNSTANCIAS?

PRETENDE MEDIR?

(Hogan, 2004)

CONFIABILIDAD
Refiere a:
a) la confianza que puede tenerse en una medicin

b) la consistencia de los puntajes obtenidos por las mismas


personas cuando son evaluadas con una misma tcnica, con
tcnicas equivalentes o en situaciones diferentes
(Hogan, 2004)

NOCIN DE ERROR
TODA MEDICIN CONTIENE CIERTA CANTIDAD DE ERROR

La confiabilidad permite saber hasta qu punto las diferencias en las


puntaciones se deben a diferencias verdaderas existentes en la variable que

intentamos medir o hasta que punto se deben


a errores del proceso de medicin
VARIANZA DE ERROR

TIPOS DE ERROR

ERRORES SISTEMATICOS
Genera constantemente una
puntuacin elevada o baja
independientemente de los
cambios en el rasgo medido
Sesgo de medicin: fuente de
variacin que
sistemticamente afecta a las
puntuaciones de un
determinado grupo (se
controla a travs de
procedimientos de validez)

ERRORES ALEATORIOS
Son impredecibles y forman parte
de todo proceso de medicin.
Se controla a travs de los
mtodos para verificar la
confiabilidad

Supuesto fundamental de la medicin


psicolgica (TCT):
La puntuacin observable de una persona
en un test es en funcin de dos
componentes:
su puntaje verdadero (no observable)
el error de medicin implcito en la prueba
Oi= Vi + Ei

* Desde la TCT la confiabilidad: proporcin


de la variancia observada de las
puntuacin del test que se debe a la
variancia verdadera

Variancia: dispersin promedio de los


puntajes de test alrededor de la media

La confiabilidad se verifica mediante un


coeficiente de correlacin entre las medidas
repetidas de un fenmeno.
Un coeficiente de correlacin .80 sugiere que
un 64% de la varianza observada se debe a la
variabilidad de la puntuacin verdadera.

FUENTES DE INESTABILIDAD
QUE AFECTAN A LA CONFIABILIDAD
CALIFICACIN DE LA PRUEBA: Variaciones en los criterios
de calificacin. Evitar que los contenidos sean tendenciosos o
insuficientes

CONTENIDO DE LA PRUEBA: Variaciones en el muestreo de


los reactivos
CONDICIONES DE APLICACIN: Variaciones en la
administracin de la prueba: consigna, condiciones del
ambiente, tiempo, protocolos, etc
CONDICIONES PERSONALES: Variaciones que pueden darse
en los evaluados: motivacin, atencin, preocupaciones
personales, estado de salud, cansancio, sueo, etc.
(Hogan, 2004)

DIMENSIONES DE LA
CONFIABILIDAD
1- ESTABILIDAD: en qu grado el puntaje de un individuo est libre de
errores de medicin por cambios personales aleatorios o en las
condiciones de administracin?. Metodo Test- retest y el metodo de
formas equivalentes, cuando ambas formas del test son aplicadas con
un intervalo de tiempo.

2- CONSISTENCIA INTERNA: en que grado la muestra de items es una


fuente de error en la medicion?. En que grado los distintos items miden
el mismo constructo o dominio?. Metodo de formas equivalentes, el
metodo de particion en mitades y el metodo del coeficiente alfa de
Cronbach.
3- CONFIABILIDAD INTER-EXAMINADORES: en que grado la medicion
de un rasgo es independiente de la subjetividad del evaluador?.
Metodo: Acuerdo inter-juez.

MTODOS PARA ESTABLECER LA CONFIABILIDAD

MTODO TEST-RETEST

Consiste en repetir
la toma en una segunda
oportunidad

Evala: los cambios en las


condiciones personales y en las
condiciones de aplicacin

Se obtiene coeficiente de estabilidad:


coeficiente de correlacin
EFECTO DE LA PRCTICA y DE LA MEMORIA
EL PROBLEMA DE LA MOTIVACION

INCONVENIENTES

DIFICULTAD PARA ESTABLECER TIEMPO ENTRE


TOMAS: atender a caractersticas variable medida y
de la poblacin meta del test
POCA PRACTICIDAD
DEPENDE DEL TIPO DE CONSTRUCTO QUE SE
MIDA

FORMAS EQUIVALENTES
PARALELAS

Se preparan dos formas


equivalentes de la misma tcnica,
se las administra y se calcula la
correlacin entre los puntajes
obtenidos por las mismas personas

Busca evaluar falta de


confiabilidad debido al
muestreo del contenido

REDUCE PERO NO ELIMINA EL


EFECTO DE LA PRCTICA

INCONVENIENTES

COSTOSO
DIFICULTAD PARA ESTABLECER LA
EQUIVALENCIA Y DIFERENCIA ENTRE
LAS FORMAS

CONSISTENCIA INTERNA
DIVISIN POR MITADES
Consiste en dividir la tcnica en mitades
comparables que luego se correlacionan.
Mtodo: separar tems pares e impares. Poco empleado.
Dificultad para lograr que las mitades obtenidas sean comparables

METODO DE COVARIANZA DE LOS ITEMS


COEFICIENTE ALFA DE CRONBACH Y KUDER-RICHARDSON

En
pruebas
politmicas

Permiten evaluar si la
prueba es homognea

En
pruebas
dicotmicas

Coeficiente Alfa de Cronbach es la media de todas


las correlaciones de particion por mitades posibles.
En que medida los diferentes items miden una
misma variable?
El mtodo ms popular para estimar la consistencia
interna
No es apropiado para los test de velocidad o tiempo
limitado (test-retest o formas equivalentes).
Aumenta con el nmero de items (uso adicional del
coef. de correlacin inter-item- entre 0.15 Y 0.50)

CONFIABILIDAD INTERJUECES:
ndice de Kappa, permite estimar la concordancia
entre observadores (superior a .80) cuando se trata
de escalas nominales.
Coeficiente de Correlacin Intraclase, w de Kendall
o kappa modificado, con escalas ordinales o
intervalares.

Se evala la variacin no sistemtica debida


solo a quienes califican la prueba

Dimensin de la
confiabilidad

Mtodo

N de sesiones de
administracin

Estadsticos

Estabilidad

Test-retest

r de Pearson

Formas paralelas

r de Pearson

Coeficiente alfa de
Cronbach

Alfa, KuderRichardson

Formas paralelas

r de Pearson

Particin en mitades

r y frmula de
correccin
SpearmanBrown

Acuerdo entre
examinadores

Kappa, w de
Kendall,
coeficiente de
correlacin
intraclase

Consistencia interna

Confiabilidad entre
examinadores

Confiabilidad y puntuaciones
individuales

O= V + E
Puntuacin verdadera es terica. Puedo
estimar la ubicacin del PV con un cierto
grado de confianza.
Error estndar de medicin (EEM)
Establecimiento de intervalos de confianza
Cuanto mayor es el coeficiente de
confiabilidad, menor el error estndar de
medicin: ms confianza en la precisin del
puntaje observado (menor el intervalo)

VALIDEZ
Se relaciona con la investigacin del
significado terico de las puntuaciones de un
test
Constructo terico: representacin abstracta
de un conjunto de comportamientos
relacionados (ej. personalidad, inteligencia,
ansiedad, etc.)

HISTORIA VALIDEZ: Tres fases


1- OPERACIONAL (hasta 50): predomina
perspectiva pragmtica de aplicaciones de los
tests. Validez predictiva.
2- TEORA PSICOLGICA: Validez de
contenido y de constructo

3- PERODO ACTUAL: se agrega importancia al


uso del instrumento

VALIDEZ DE CRITERIO
VALIDEZ PREDICTIVA

En qu medida es posible anticipar un logro


o comportamiento futuro?
MTODO: Se correlaciona el desempeo en la prueba con

algn criterio externo, establecido a futuro


VALIDEZ CONCURRENTE
Se establece comparando las puntuaciones de una tcnica con

un criterio externo, pero en forma inmediata y no a futuro


MEDIDAS DE
CRITERIO

Criterio Externo
Otras Pruebas
Grupos Contrastados

VALIDEZ CONVERGENTE Y DISCRIMINANTE


Indica una correlacin alta entre
la prueba y algn criterio
que se considera mide
el mismo constructo

Supone una baja correlacin


con constructos distintos
al que se pretende medir

Mtodo: multirasgo-multimtodo
Alta correlacin entre los mismos rasgos medidos con
diferentes mtodos.
Baja correlacin entre distintos rasgos
medidos con el mismo mtodo

VALIDEZ DE CONTENIDO
CONSTRUCTO

PRUEBA
ITEMS

Comprende la prueba una

muestra representativa del


constructo que mide?

MTODO: ANLISIS SISTEMTICO DE LOS


CONTENIDOS DE LA TCNICA

MTODO: JUICIO DE EXPERTOS

TIPOS DE VALIDEZ
VALIDEZ DE CONSTRUCTO: aspecto fundamental
e inclusivo de las restantes dimensiones de validez
TEORA

En qu medida la
prueba mide

CONSTRUCTO

el constructo
terico?

PRUEBA

MTODOS:
ANLISIS FACTORIAL
CORRELACIN CON OTRAS PRUEBAS

ANALISIS FACTORIAL
Flia. de tcnicas estadsticas que ayudan a
identificar dimensiones comunes que
subyacen en mediciones diferentes
Matriz de correlaciones
Formas diferentes de extraer los factores de
acuerdo a criterios matemticos
Varios procedimientos de rotacin para
favorecer la interpretacin

Tabla 1. Anlisis Factorial exploratorio del Juego Simn Dice, Parte I. Mtodo de rotacin Varimax.
A correr

Factor I
Inhibicin
,441

Tocarse la cabeza

,662

Hacer un giro

,734

Factor II
Activacin

,847
Aletear los brazos
,774
A saltar
,333
Simn dice: a sentarse
,441
Simn dice: a correr
Aplaudir

,824

Dar un paso adelante

,843

Dar un paso atrs

,872

Tocarse la nariz

,666

Simn dice: Hacer un giro

,747

Simn dice: Aletear los brazos

,775

Periodo actual o contextual del


concepto de validez
Importancia del uso del instrumento: nunca se
valida un test en si mismo sino que se verifica la
validez para determinado proposito.
No se habla de tipos de validez sino de un
proceso de recoleccion de evidencia de validez
para un concepto unitario.
VALIDEZ: adecuacion, significacion y utilidad de
las inferencias especificas hechas a partir de las
puntuaciones de un test

FUENTES INTERNAS DE
EVIDENCIA
1- Evidencia basada en el contenido del test: es
mas factible en pruebas de rendimiento donde
se verifica la representatividad y relevancia del
contenido con respecto a objetivos, actividades,
conocimientos y destrezas. Metodo: Juicio de
expertos

2- Evidencia basada en la estructura interna del


test: relaciones entre items y las dimensiones
(factores o escalas) permiten confirmar la
existencia del constructo a medir.
Metodo: Analisis Factorial

3- Evidencia basada en el proceso de respuesta


Se analizan los procesos cognitivos
comprometidos en el proceso de respuesta al
test (por ej. Razonamiento, tendencia a la
conformidad social, diferencias entre subgrupos
varones mujeres, grupos etnicos, etc)
Metodo: entrevistas, protocolos de respuesta,
procedimiento que analice cualitativamente las
respuestas .

FUENTES EXTERNAS DE
EVIDENCIA DE VALIDEZ
Analisis de las relaciones de las puntuaciones
con variables externas:
- medidas en base a algun criterio que el test
intenta predecir, o
- Puntuaciones de otros tests que miden
constructos semejantes o diferentes

FUENTES EXTERNAS DE
EVIDENCIA DE VALIDEZ
1- Evidencia convergente- discriminante: se
compara los puntajes con:
- otros test elaborados para medir el mismo
atributo
- otros diseados para medir otros atributos
Mtodo: matriz multi-rasgo- multi-metodo
(matriz de correlaciones entre dos o mas
instrumentos construidos para medir
constructos semejantes) Anlisis Factorial
Confirmatorio.

2- Evidencia de las relaciones entre las puntuaciones


del test y criterios externos: muy importante en
contextos aplicados (predecir)
a) Correlacin bivariada con un criterio: efectividad
del test para predecir el desempeo de una
muestra en una situacin real diferente del test en
si mismo.
Coeficiente producto-momento de Pearson para 2
variables continuas
Coeficiente punto-biserial para escalas intervalares
Coeficiente de rangos de Spearman para escalas
ordinales

2- Evidencia de las relaciones entre las puntuaciones del


test y criterios externos: muy importante en contextos
aplicados (predecir)
b) Correlacin mltiple con un criterio: enfoque multivariado que
permite esclarecer las interrelaciones entre un conjunto de
predictores y uno o mas criterios. Finalidades:
- Predecir la pertenencia a un grupo
- Explicar la variabilidad de una variable dependiente
- Verificar la estructura de un constructo
Mtodos:
- Anlisis Factorial
- Regresin Mltiple
- Anlisis de senderos
- Anlisis discriminante

3- Evidencia de las consecuencias de la


aplicacion de tests
Son relevantes para la validez cuando se relaciona
con alguna fuente de invalidez:
- Una pobre representacion del constructo
- Existencia de componentes no relevantes para el
constructo
No afectan a la validez la informacion referida a las
decisiones en politicas sociales (diferencias
intergrupales no necesariamente implica una falta de
validez del test)

Validez ecolgica
Grado en que la prueba tiene sentido en el mbito en el
que se aplica.

Insiste por un lado en la semejanza entre las condiciones


de investigacin y las condiciones del mundo real en que
se produce un fenmeno; y por otro, en que el sujeto
experimente la situacin de investigacin con las mismas
propiedades que el investigador supone (Bronfenbrenner,
1977)

Potrebbero piacerti anche