Tecnicas Psicometricas 2015 Confiabilidad y Validez

VALIDEZ Y CONFIABILIDAD
Tcnicas Psicomtricas
PROPIEDADES
PSICOMTRICAS- Estndares Tcnicos
VALIDEZ
CONFIABILIDAD
Se refiere a lo que mide una
Se relaciona con la
prueba y no puede expresarse en
consistencia de la medicin,
general sino que debe consignarse
al margen de que lo mida exactamente
el uso particular para el que se
Una prueba es confiable si es
planea utilizar el instrumento
consistente y precisa
MIDE LA PRUEBA
EL CONSTRUCTO QUE
LA PRUEBA FUNCIONA
DE MANERA SIMILAR o CONSTANTE
BAJO DIFERENTES
CONDICIONES o CIRCUNSTANCIAS?
PRETENDE MEDIR?
(Hogan, 2004)
CONFIABILIDAD
Refiere a:
a) la confianza que puede tenerse en una medicin
b) la consistencia de los puntajes obtenidos por las mismas

personas cuando son evaluadas con una misma tcnica, con
tcnicas equivalentes o en situaciones diferentes
(Hogan, 2004)
NOCIN DE ERROR
TODA MEDICIN CONTIENE CIERTA CANTIDAD DE ERROR
La confiabilidad permite saber hasta qu punto las diferencias en las

puntaciones se deben a diferencias verdaderas existentes en la variable que
intentamos medir o hasta que punto se deben

a errores del proceso de medicin
VARIANZA DE ERROR
TIPOS DE ERROR
ERRORES SISTEMATICOS
Genera constantemente una
puntuacin elevada o baja
independientemente de los
cambios en el rasgo medido
Sesgo de medicin: fuente de
variacin que
sistemticamente afecta a las
puntuaciones de un
determinado grupo (se
controla a travs de
procedimientos de validez)
ERRORES ALEATORIOS
Son impredecibles y forman parte
de todo proceso de medicin.
Se controla a travs de los
mtodos para verificar la
confiabilidad
Supuesto fundamental de la medicin

psicolgica (TCT):
La puntuacin observable de una persona
en un test es en funcin de dos
componentes:
su puntaje verdadero (no observable)
el error de medicin implcito en la prueba
Oi= Vi + Ei
* Desde la TCT la confiabilidad: proporcin

de la variancia observada de las
puntuacin del test que se debe a la
variancia verdadera
Variancia: dispersin promedio de los

puntajes de test alrededor de la media
La confiabilidad se verifica mediante un

coeficiente de correlacin entre las medidas
repetidas de un fenmeno.
Un coeficiente de correlacin .80 sugiere que
un 64% de la varianza observada se debe a la
variabilidad de la puntuacin verdadera.
FUENTES DE INESTABILIDAD
QUE AFECTAN A LA CONFIABILIDAD
CALIFICACIN DE LA PRUEBA: Variaciones en los criterios
de calificacin. Evitar que los contenidos sean tendenciosos o
insuficientes
CONTENIDO DE LA PRUEBA: Variaciones en el muestreo de

los reactivos
CONDICIONES DE APLICACIN: Variaciones en la
administracin de la prueba: consigna, condiciones del
ambiente, tiempo, protocolos, etc
CONDICIONES PERSONALES: Variaciones que pueden darse
en los evaluados: motivacin, atencin, preocupaciones
personales, estado de salud, cansancio, sueo, etc.
(Hogan, 2004)
DIMENSIONES DE LA
CONFIABILIDAD
1- ESTABILIDAD: en qu grado el puntaje de un individuo est libre de
errores de medicin por cambios personales aleatorios o en las
condiciones de administracin?. Metodo Test- retest y el metodo de
formas equivalentes, cuando ambas formas del test son aplicadas con
un intervalo de tiempo.
2- CONSISTENCIA INTERNA: en que grado la muestra de items es una

fuente de error en la medicion?. En que grado los distintos items miden
el mismo constructo o dominio?. Metodo de formas equivalentes, el
metodo de particion en mitades y el metodo del coeficiente alfa de
Cronbach.
3- CONFIABILIDAD INTER-EXAMINADORES: en que grado la medicion
de un rasgo es independiente de la subjetividad del evaluador?.
Metodo: Acuerdo inter-juez.
MTODOS PARA ESTABLECER LA CONFIABILIDAD
MTODO TEST-RETEST
Consiste en repetir
la toma en una segunda
oportunidad
Evala: los cambios en las

condiciones personales y en las
condiciones de aplicacin
Se obtiene coeficiente de estabilidad:

coeficiente de correlacin
EFECTO DE LA PRCTICA y DE LA MEMORIA
EL PROBLEMA DE LA MOTIVACION
INCONVENIENTES
DIFICULTAD PARA ESTABLECER TIEMPO ENTRE

TOMAS: atender a caractersticas variable medida y
de la poblacin meta del test
POCA PRACTICIDAD
DEPENDE DEL TIPO DE CONSTRUCTO QUE SE
MIDA
FORMAS EQUIVALENTES
PARALELAS
Se preparan dos formas

equivalentes de la misma tcnica,
se las administra y se calcula la
correlacin entre los puntajes
obtenidos por las mismas personas
Busca evaluar falta de

confiabilidad debido al
muestreo del contenido
REDUCE PERO NO ELIMINA EL

EFECTO DE LA PRCTICA
INCONVENIENTES
COSTOSO
DIFICULTAD PARA ESTABLECER LA
EQUIVALENCIA Y DIFERENCIA ENTRE
LAS FORMAS
CONSISTENCIA INTERNA
DIVISIN POR MITADES
Consiste en dividir la tcnica en mitades
comparables que luego se correlacionan.
Mtodo: separar tems pares e impares. Poco empleado.
Dificultad para lograr que las mitades obtenidas sean comparables
METODO DE COVARIANZA DE LOS ITEMS

COEFICIENTE ALFA DE CRONBACH Y KUDER-RICHARDSON
En
pruebas
politmicas
Permiten evaluar si la
prueba es homognea
En
pruebas
dicotmicas
Coeficiente Alfa de Cronbach es la media de todas

las correlaciones de particion por mitades posibles.
En que medida los diferentes items miden una
misma variable?
El mtodo ms popular para estimar la consistencia
interna
No es apropiado para los test de velocidad o tiempo
limitado (test-retest o formas equivalentes).
Aumenta con el nmero de items (uso adicional del
coef. de correlacin inter-item- entre 0.15 Y 0.50)
CONFIABILIDAD INTERJUECES:
ndice de Kappa, permite estimar la concordancia
entre observadores (superior a .80) cuando se trata
de escalas nominales.
Coeficiente de Correlacin Intraclase, w de Kendall
o kappa modificado, con escalas ordinales o
intervalares.
Se evala la variacin no sistemtica debida

solo a quienes califican la prueba
Dimensin de la
confiabilidad
Mtodo
N de sesiones de
administracin
Estadsticos
Estabilidad
Test-retest
r de Pearson
Formas paralelas
r de Pearson
Coeficiente alfa de
Cronbach
Alfa, KuderRichardson
Formas paralelas
r de Pearson
Particin en mitades
r y frmula de
correccin
SpearmanBrown
Acuerdo entre
examinadores
Kappa, w de
Kendall,
coeficiente de
correlacin
intraclase
Consistencia interna
Confiabilidad entre
examinadores
Confiabilidad y puntuaciones
individuales
O= V + E
Puntuacin verdadera es terica. Puedo
estimar la ubicacin del PV con un cierto
grado de confianza.
Error estndar de medicin (EEM)
Establecimiento de intervalos de confianza
Cuanto mayor es el coeficiente de
confiabilidad, menor el error estndar de
medicin: ms confianza en la precisin del
puntaje observado (menor el intervalo)
VALIDEZ
Se relaciona con la investigacin del
significado terico de las puntuaciones de un
test
Constructo terico: representacin abstracta
de un conjunto de comportamientos
relacionados (ej. personalidad, inteligencia,
ansiedad, etc.)
HISTORIA VALIDEZ: Tres fases

1- OPERACIONAL (hasta 50): predomina
perspectiva pragmtica de aplicaciones de los
tests. Validez predictiva.
2- TEORA PSICOLGICA: Validez de
contenido y de constructo
3- PERODO ACTUAL: se agrega importancia al

uso del instrumento
VALIDEZ DE CRITERIO
VALIDEZ PREDICTIVA
En qu medida es posible anticipar un logro

o comportamiento futuro?
MTODO: Se correlaciona el desempeo en la prueba con
algn criterio externo, establecido a futuro

VALIDEZ CONCURRENTE
Se establece comparando las puntuaciones de una tcnica con
un criterio externo, pero en forma inmediata y no a futuro

MEDIDAS DE
CRITERIO
Criterio Externo
Otras Pruebas
Grupos Contrastados
VALIDEZ CONVERGENTE Y DISCRIMINANTE

Indica una correlacin alta entre
la prueba y algn criterio
que se considera mide
el mismo constructo
Supone una baja correlacin

con constructos distintos
al que se pretende medir
Mtodo: multirasgo-multimtodo
Alta correlacin entre los mismos rasgos medidos con
diferentes mtodos.
Baja correlacin entre distintos rasgos
medidos con el mismo mtodo
VALIDEZ DE CONTENIDO
CONSTRUCTO
PRUEBA
ITEMS
Comprende la prueba una
muestra representativa del

constructo que mide?
MTODO: ANLISIS SISTEMTICO DE LOS

CONTENIDOS DE LA TCNICA
MTODO: JUICIO DE EXPERTOS
TIPOS DE VALIDEZ
VALIDEZ DE CONSTRUCTO: aspecto fundamental
e inclusivo de las restantes dimensiones de validez
TEORA
En qu medida la
prueba mide
CONSTRUCTO
el constructo
terico?
PRUEBA
MTODOS:
ANLISIS FACTORIAL
CORRELACIN CON OTRAS PRUEBAS
ANALISIS FACTORIAL
Flia. de tcnicas estadsticas que ayudan a
identificar dimensiones comunes que
subyacen en mediciones diferentes
Matriz de correlaciones
Formas diferentes de extraer los factores de
acuerdo a criterios matemticos
Varios procedimientos de rotacin para
favorecer la interpretacin
Tabla 1. Anlisis Factorial exploratorio del Juego Simn Dice, Parte I. Mtodo de rotacin Varimax.
A correr
Factor I
Inhibicin
,441
Tocarse la cabeza
,662
Hacer un giro
,734
Factor II
Activacin
,847
Aletear los brazos
,774
A saltar
,333
Simn dice: a sentarse
,441
Simn dice: a correr
Aplaudir
,824
Dar un paso adelante
,843
Dar un paso atrs
,872
Tocarse la nariz
,666
Simn dice: Hacer un giro
,747
Simn dice: Aletear los brazos
,775
Periodo actual o contextual del

concepto de validez
Importancia del uso del instrumento: nunca se
valida un test en si mismo sino que se verifica la
validez para determinado proposito.
No se habla de tipos de validez sino de un
proceso de recoleccion de evidencia de validez
para un concepto unitario.
VALIDEZ: adecuacion, significacion y utilidad de
las inferencias especificas hechas a partir de las
puntuaciones de un test
FUENTES INTERNAS DE
EVIDENCIA
1- Evidencia basada en el contenido del test: es
mas factible en pruebas de rendimiento donde
se verifica la representatividad y relevancia del
contenido con respecto a objetivos, actividades,
conocimientos y destrezas. Metodo: Juicio de
expertos
2- Evidencia basada en la estructura interna del

test: relaciones entre items y las dimensiones
(factores o escalas) permiten confirmar la
existencia del constructo a medir.
Metodo: Analisis Factorial
3- Evidencia basada en el proceso de respuesta

Se analizan los procesos cognitivos
comprometidos en el proceso de respuesta al
test (por ej. Razonamiento, tendencia a la
conformidad social, diferencias entre subgrupos
varones mujeres, grupos etnicos, etc)
Metodo: entrevistas, protocolos de respuesta,
procedimiento que analice cualitativamente las
respuestas .
FUENTES EXTERNAS DE
EVIDENCIA DE VALIDEZ
Analisis de las relaciones de las puntuaciones
con variables externas:
- medidas en base a algun criterio que el test
intenta predecir, o
- Puntuaciones de otros tests que miden
constructos semejantes o diferentes
FUENTES EXTERNAS DE
EVIDENCIA DE VALIDEZ
1- Evidencia convergente- discriminante: se
compara los puntajes con:
- otros test elaborados para medir el mismo
atributo
- otros diseados para medir otros atributos
Mtodo: matriz multi-rasgo- multi-metodo
(matriz de correlaciones entre dos o mas
instrumentos construidos para medir
constructos semejantes) Anlisis Factorial
Confirmatorio.
2- Evidencia de las relaciones entre las puntuaciones

del test y criterios externos: muy importante en
contextos aplicados (predecir)
a) Correlacin bivariada con un criterio: efectividad
del test para predecir el desempeo de una
muestra en una situacin real diferente del test en
si mismo.
Coeficiente producto-momento de Pearson para 2
variables continuas
Coeficiente punto-biserial para escalas intervalares
Coeficiente de rangos de Spearman para escalas
ordinales
2- Evidencia de las relaciones entre las puntuaciones del

test y criterios externos: muy importante en contextos
aplicados (predecir)
b) Correlacin mltiple con un criterio: enfoque multivariado que
permite esclarecer las interrelaciones entre un conjunto de
predictores y uno o mas criterios. Finalidades:
- Predecir la pertenencia a un grupo
- Explicar la variabilidad de una variable dependiente
- Verificar la estructura de un constructo
Mtodos:
- Anlisis Factorial
- Regresin Mltiple
- Anlisis de senderos
- Anlisis discriminante
3- Evidencia de las consecuencias de la

aplicacion de tests
Son relevantes para la validez cuando se relaciona
con alguna fuente de invalidez:
- Una pobre representacion del constructo
- Existencia de componentes no relevantes para el
constructo
No afectan a la validez la informacion referida a las
decisiones en politicas sociales (diferencias
intergrupales no necesariamente implica una falta de
validez del test)
Validez ecolgica
Grado en que la prueba tiene sentido en el mbito en el
que se aplica.
Insiste por un lado en la semejanza entre las condiciones

de investigacin y las condiciones del mundo real en que
se produce un fenmeno; y por otro, en que el sujeto
experimente la situacin de investigacin con las mismas
propiedades que el investigador supone (Bronfenbrenner,
1977)

Tecnicas Psicometricas 2015 Confiabilidad y Validez

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Tecnicas Psicometricas 2015 Confiabilidad y Validez

Caricato da

Copyright:

Formati disponibili

VALIDEZ Y CONFIABILIDAD

Se refiere a lo que mide una

prueba y no puede expresarse en

general sino que debe consignarse

al margen de que lo mida exactamente

el uso particular para el que se

Una prueba es confiable si es

planea utilizar el instrumento

b) la consistencia de los puntajes obtenidos por las mismas

La confiabilidad permite saber hasta qu punto las diferencias en las

intentamos medir o hasta que punto se deben

Supuesto fundamental de la medicin

* Desde la TCT la confiabilidad: proporcin

Variancia: dispersin promedio de los

La confiabilidad se verifica mediante un

CONTENIDO DE LA PRUEBA: Variaciones en el muestreo de

2- CONSISTENCIA INTERNA: en que grado la muestra de items es una

MTODOS PARA ESTABLECER LA CONFIABILIDAD

Evala: los cambios en las

Se obtiene coeficiente de estabilidad:

DIFICULTAD PARA ESTABLECER TIEMPO ENTRE

Se preparan dos formas

Busca evaluar falta de

REDUCE PERO NO ELIMINA EL

METODO DE COVARIANZA DE LOS ITEMS

Coeficiente Alfa de Cronbach es la media de todas

Se evala la variacin no sistemtica debida

HISTORIA VALIDEZ: Tres fases

3- PERODO ACTUAL: se agrega importancia al

En qu medida es posible anticipar un logro

algn criterio externo, establecido a futuro

un criterio externo, pero en forma inmediata y no a futuro

VALIDEZ CONVERGENTE Y DISCRIMINANTE

Supone una baja correlacin

Comprende la prueba una

muestra representativa del

MTODO: ANLISIS SISTEMTICO DE LOS

MTODO: JUICIO DE EXPERTOS

Dar un paso adelante

Dar un paso atrs

Simn dice: Hacer un giro

Simn dice: Aletear los brazos

Periodo actual o contextual del

2- Evidencia basada en la estructura interna del

3- Evidencia basada en el proceso de respuesta

2- Evidencia de las relaciones entre las puntuaciones

2- Evidencia de las relaciones entre las puntuaciones del

3- Evidencia de las consecuencias de la

Insiste por un lado en la semejanza entre las condiciones

Potrebbero piacerti anche