Validez y Confiabilidad de Un Test

PSICOMETRIA
Realice un informe acadmico sobre la importancia de la validez y confiabilidad

de un test y envalo a travs de Validez y confiabilidad de un test
VALIDEZ
Para cerciorarse y confirmar la veracidad de un instrumento de recoleccin de
datos se necesita saber si este tiene Validez
Kerlinger; define La validez como una cuestin ms compleja que debe
alcanzarse en todo instrumento de medicin que se aplica. Si se mide lo que se
pretende, entonces es vlido, sino no lo es. En pocas palabras podemos decir
que validez es el grado en que un instrumento mide lo que pretende medir.
La validez de un mtodo es la exactitud con que pueden hacerse medidas
significativas y adecuadas con l; en el sentido que midan realmente los rasgos
que se pretenden medir, por ejemplo un instrumento para medir la inteligencia
vlida debe medir la inteligencia y no la memoria.
CONCEPTOS DE VALIDEZ
Campbell y Fisk (1987 Ct. Hammersley)
El acuerdo entre dos esfuerzos para medir la misma cosa con
diferentes mtodos
Black and Champion (1976)
La medida en que un instrumento mide lo que se supone que debe
medir
Lehner (1979)
Correccin
Johnston and Pennypacker (1980)
Grado de aproximacin de la realidad
Kerlinger (1964)
Estamos midiendo lo que suponemos medir
Medley and Mitzel (1987 Ct. Hammersley)
UNIVERSIDAD PRIVADA TELESUP
PSICOMETRIA
Sostener que las diferencias en las medidas obtenidas reflejan una
diferencia real
Hernndez Sampieri
Grado en que un instrumento realmente mide la variable que pretende
medir.
Thorndike
Grado en que un instrumento realmente
mide lo que el investigador
pretende.
Cuando estimamos la validez de un test, necesitamos saber que rasgo
deseamos que mida. Este rasgo se llama variable de criterio. Nos interesa
saber que tan bien corresponde las posiciones de los individuos en la
distribucin de los puntajes obtenidos a sus posiciones en el continuo que
representan la variable de criterio.
La validez es tradicionalmente estimada por un coeficiente de correlacin,
llamado coeficiente de validez, el cual indica la relacin que hay entre los datos
obtenidos con el test y los datos que usamos con un grado conocido de
certeza, como ndices para los puntajes de los individuos en la variable de
criterio. En todo procedimiento de validacin la cuestin esencial es: Para qu
y para quin es vlido el test?; se necesita por consiguiente criterios diferentes
para diferentes propsitos de test. Como criterio de exactitud se necesita tener
una expresin lo ms exacta posible de las posiciones de los individuos en la
distribucin del criterio verdadero.
Para que una medicin sea vlida debe medir lo que desea medir libre de
distorsiones sistemtica, y as poder inferir conclusiones a partir de los
resultados obtenidos; por ejemplo, un instrumento vlido para medir la actitud
de los clientes frente a la calidad del servicio de una empresa debe medir la
actitud y no el conocimiento del cliente respecto de la calidad del servicio.
TIPOS DE VALIDEZ:
Cmo podemos determinar si una prueba dad en realidad mide lo que afirma
medir?
PSICOMETRIA
(Wiersma, 1986 y Gronlund, 1985), dicen que la validez, es un concepto que
puede obtenerse de diferentes tipos de evidencias. En resumen la validez se
puede examinar desde diferentes perspectivas, estas son:
1. VALIDEZ GENERAL:
Est relacionado con tener una idea clara de la variable que desea
medirse y evaluar si las preguntas o los artculos del instrumento en
realidad lo miden, en pocas palabras se refiere al juicio que se hace
respecto del grado en que el instrumento de medicin mide lo que debe
medir.
2. VALIDEZ DE CONTENIDO:
Es el grado en que la medicin representa al concepto medido, es decir,
que una prueba tenga una muestra adecuada de preguntas que miden
las habilidades o conocimiento que se desea medir.
Consiste en demostrar que los elementos que constituyen el test
pertenecen al mismo universo de contenido, para demostrarlo se puede
seguir el criterio del rigor lgico de pertenencia y tambin el criterio de
expertos llamados jueces. Este mtodo parte del supuesto que si
llegamos a demostrar que los componentes del test pertenecen a un
mismo parmetro de referencia, sin lugar a duda estamos cumpliendo
con medir lo propuesto. Los contenidos y los tems seleccionados no
debern discrepar significativamente entre la opinin de los jueces. En
otras palabras, la validez de contenido es cuestin de determinar si la
muestra de sus reactivos es representativa del universo o dominio
conductual
de
tems
al
que
supuestamente
representa.
Un
procedimiento para que el proceso de enjuiciamiento de los reactivos

sea lo ms objetivo posible, es el siguiente:
EL CONSTRUCTOR DE LA PRUEBA:
-
Define especficamente el dominio del contenido por medio de una

descripcin que lo debe delimitar claramente.
Define, si fuera necesario, subcategoras importantes del dominio,

especificando esta importancia en trminos porcentuales.
PSICOMETRIA
-
JUICIO DE EXPERTOS
Consiste en preguntar a personas expertas en el dominio que miden los
tems, sobre su grado de adecuacin a un criterio determinado y
previamente establecido en los pasos anteriormente reseados de
construccin de una prueba. Para esta validacin se siguen dos
procedimientos (Osterlind, 1989):
I.
Emparejamiento de tems y objetivo/s o dominio/s, a juicio de los jueces. En

este procedimiento se oculta a los jueces el emparejamiento objetivo-tem para
comprobar si, dicho emparejamiento, es tan evidente que una persona experta
lo pueda descubrir.
II.
Juicio del grado de adecuacin entre cada tem y el subdominio u objetivo que
pretende medir el tem.
3. VALIDEZ CON RELACIN AL CRITERIO:
Tiene que ver con la eficacia que tiene un instrumento para predecir
conductas especficas en determinados momentos. Establece la validez
de un instrumento de medicin comparndola con algn criterio externo.
Entre ms se relacionen los resultados del instrumento con el criterio,
mayor ser su validez.
Validez Predictiva (evidencia externa):
Consiste en determinar si el test elaborado es capaz de pronosticar
una consecuencia o resultado asociado con la variable que hemos
medido. Este tipo de validez es de mucha utilidad en la prevencin
primaria, ya que permitir prever los sujetos que presentarn
dificultad, como tambin la deteccin de aquellos que alcanzarn las
metas de un programa precozmente, permitiendo en ambos casos
adoptar las medidas necesarias, cuanto mayor es la exactitud de
prediccin del resultado (es decir del criterio externo), tanto ms til
ser la prueba. Por ejemplo, el test ser un componente aceptable
de un proceso de seleccin de personal, si sus calificaciones o
puntuaciones predicen la ejecucin
de algn componente
PSICOMETRIA
importante del trabajo (criterio externo); en otras palabras, para que
el test se pueda utilizar como parte de un proceso de seleccin es
preciso demostrar la validez de la prueba relacionndola con los
criterios pertinentes.
Validez Concurrente:
Consiste en determinar otra variable diferente a la medida con el
test, con la que se supone guardan correlacin significativa, para
establecer este tipo de validez debern efectuarse dos mediciones
una de ellas corresponde a la del test elaborado y la otra a la
variable con la que se supone guardan correlacin. Cuando
computamos los coeficientes de validez, es necesario que los datos
del test y los del criterio se determinen en forma independiente. Por
ejemplo: El psiclogo tiene una
hiptesis acerca de cmo dos
grupos de individuos que difieren en ciertos aspectos, tambin

difieren con respecto a alguna otra variable la cual es el objeto de su
inters. Conociendo la pertenencia de grupo, l evala a los dos
miembros de los dos grupos sobre la segunda variable y computa la
correlacin entre las evaluaciones y la pertenencia del grupo, la cual
se constituye el criterio. El psiclogo ha sido presa de lo que se
conoce como contaminacin de criterio. El conoca los datos del
criterio, es decir, la pertenencia de grupo, cuando hizo las
estimaciones cuya validez fue robada usando la pertenencia de
grupo como criterio. Tal procedimiento no est permitido. No importa
que el evaluador intente ignorar su conocimiento previo no puede
evitar el ser influido en algn sentido por sus expectativas.
4. VALIDEZ DE CONSTRUCTO:
Un constructo es una variable medida y que tiene lugar dentro de una
teora o esquema terico. Hernndez, Fernndez y Baptista (1997)
refieren que la validez de constructo es probablemente la ms
importante, sobre todo desde una perspectiva cientfica. El instrumento
se juzga respecto del grado en que una medicin se relaciona
PSICOMETRIA
consistentemente con otras mediciones
sobre conceptos que estn
midindose
Este mtodo consiste en demostrar que el test elaborado confirma los
supuestos tericos. Para lo cual desarrolla modelos experimentales, que
le permita obtener la validez interna y externa de los supuestos tericos,
en la validez interna deber demostrarse la coherencia entre los
postulados, corolarios y teoremas, de tal forma que se pueda
desprender con facilidad y sin perder el rigor lgico posibles aplicaciones
que soporten la comprobacin experimental. En la validez externa
deber comprobarse que los supuestos tericos guardan relacin
explicativa con las variables asumidas en un modelo emprico.
Tambin se utiliza en la validez de constructo, el anlisis factorial que
permite demostrar si los factores asumidos como parte de un fenmeno
interactan o si por lo contrario no son parte constitutiva del fenmeno
que se est estudiando.
INCLUYE TRES ETAPAS
I.
Se establece y especifica la relacin terica entre los conceptos

(Sobre la base del marco terico)
II.
Se correlacionan ambos conceptos y se analiza cuidadosamente
la correlacin
III.
Se interpreta la evidencia emprica de acuerdo a que tanto clarifica la validez de

constructo de una medicin en particular.
CARACTERSTICAS DE LA VALIDEZ:
La validez se refiere a la adecuacidad de la interpretacin de los resultados

para un grupo determinado de individuos. La validez no es una propiedad del
cuestionario; aunque, por costumbre, se sigue hablando de la validez del
cuestionario.
La validez es una cuestin de grado. No existe en trminos absolutos. No se

puede decir que el cuestionario es vlido o invlido. Aumenta o disminuye
PSICOMETRIA
dependiendo de la calidad de la evidencia que la sustenta. Nuevas evidencias
pueden incrementarla o reducirla. Hoy da la validacin de una inferencia se
presenta como el proceso de determinar si la teora y las evidencias empricas
respaldan esta inferencia.
La validez se refiere siempre a un tipo de uso o interpretacin especfico. No se

puede hablar de la validez de un cuestionario sea cual fuere su uso. A veces los
usos son muy prximos, pero aun as hay diferencias.
La validez es un concepto unitario. No se puede hablar de diferentes tipos de

validez (contenido, constructo, criterio). Se habla ms bien de un concepto
validez- y de diversos tipos de evidencia.
Para hablar de validez se requiere un juicio evaluativo comprensivo que

dictamine si las interpretaciones y usos de los resultados se justifican con la
evidencia producida.
COMO CALCULAR LA VALIDEZ
Para calcular la validez se debe tener en cuenta la siguiente:
V. CONTENIDO: Juicio de expertos
V. CRITERIO: Correlacionar la medicin con el criterio para obtener el
coeficiente de validez
V. CONSTRUCTO:
Suele determinarse un procedimiento estadstico
denominado Anlisis de Factores
TAMBIN: Slidos conocimientos estadsticos y Programas apropiados de

computadoras
PSICOMETRIA
CONFIABILIDAD
No basta con que un instrumento tenga validez para que este sea
completamente aceptado, para ello tambin est la Confiabilidad. Anastasi
y Aiken; define a la confiabilidad (o consistencia) de un test es la precisin con
que el test mide lo que mide, en una poblacin determinada y en las
condiciones normales de aplicacin. En pocas palabras es Capacidad de un
prueba para producir calificaciones consistentes y estables.
CONCEPTOS DE CONFIABILIDAD
Black and Champin (1976)
La habilidad para medir consistentemente
Lehner (1979)
Reproductividad de las mediciones estabilidad
Johnston and Pennypacker (1980)
Capacidad de alcanzar la misma capacidad estabilidad
Kerlinger (1964)
Correccin o precisin de un instrumento de medicin
Medley and Mitzel (1987 Ct Hammersley)
Sostener que la diferencia entre dos medidas obtenidas en la misma
clase es menor que la obtenida en diferentes clases
Confiabilidad, significa consistencia u obtencin, una y otra vez, de los mismos
resultados. Una tcnica de muestreo es confiable cuando varias muestras de
una misma poblacin arrojan datos similares. En la mayor parte de los casos la
Confiabilidad de la tcnica de muestreo est en relacin directa con el tamao
de la muestra. Si una prueba de inteligencia se aplica a un grupo de nios y
proporciona ciertos valores de inteligencia; se aplica un mes despus y
proporciona valores similares, diramos que la prueba es confiable.
PSICOMETRIA
CLASIFICACIN:
RELACIN CON EL CALIFICADOR: Dos expertos califican los resultados

obtenidos por un grupo, luego calculan el coeficiente de correlacin producto
momento de Pearson (r), o el porcentaje de coincidencia entre ambos
Observadores
EN EL CURSO DEL TIEMPO: El investigador obtiene valores diferentes al

aplicar el instrumento a la misma unidad de estudio en circunstancias
diferentes. Se aplica el instrumento dos veces a un mismo grupo y se
correlaciona lo resultados
EN RELACIN AL CONTENIDO DE LA PRUEBA: Muestreo o seleccin de los

datos. Variedad de contenidos que se desea medir
COMO CALCULAR LA CONFIABILIDAD
La Confiabilidad de un instrumento de medicin se determina mediante
diversos procedimientos:
I.
TEST RE-TEST O MEDIDA DE ESTABILIDAD: El investigador debe aplicar el

mismo instrumento dos veces al mismo grupo despus de cierto perodo. Debe
calcular la confiabilidad del instrumento antes de la aplicacin definitiva del
mismo. Coeficiente de correlacin de Pearson altamente positivo que es igual
al instrumento confiable.
II.
TEST PARALELOS O MTODO DE FORMAS ALTERNATIVAS: Se administran

dos o ms versiones equivalentes de un mismo instrumento. Deben ser similares en
contenido, instrucciones, tipos de preguntas y dificultad. Son administradas al mismo
grupo en un perodo relativamente corto. Los patrones de respuestas deben variar
poco entre las aplicaciones. Coeficiente de Confiabilidad es igual a la Frmula de
Correlacin de Pearson.
III.
DIVISIN POR MITADES O MITADES PARTIDAS: Requiere slo una

aplicacin de la medicin. Mientras ms tems mayor ser la confiabilidad. El
conjunto total de tems es dividido en dos mitades y se comparan las
PSICOMETRIA
puntuaciones obtenidas en ambas mediciones. Puntuaciones de ambas
mitades fuertemente correlacionadas es igual a un Instrumento confiable.
IV.
Correlacin de Spearman Brown es igual al Coeficiente de Confiabilidad.

ALFA DE CRONBACH: Requiere slo una aplicacin del instrumento de medicin.
Produce valores que oscilan entre cero (0) y uno (1). No es necesario dividir en
mitades los tems del instrumento. Se aplica la medicin y se calcula el coeficiente.
V.
TCNICA KUDER RICHARDSON O COEFICIENTE KR-20: Permite calcular

la confiabilidad con una sola aplicacin del instrumento. No requiere el diseo
de pruebas paralelas. Es aplicable slo en instrumentos con tems dicotmicos,
que puedan ser codificados con 1
0 (correcto incorrecto, presente ausente, a favor en contra, etc.)
LIMITACIONES DE ALGUNAS TCNICAS
TEST RE-TES: El periodo de tiempo entre las mediciones puede
confundir la interpretacin del coeficiente de confiabilidad obtenido
mediante esta tcnica
TEST PARALELO: Dificultad en obtener dos pruebas realmente
paralelas, implica un doble trabajo de construccin de instrumentos
TEST POR MITADES: Confiabilidad vara de acuerdo con el nmero de
tems que incluya el instrumento de medicin
La falta de confiabilidad de un test psicomtrico est en relacin con la
intervencin del error. Se considera que el error es cualquier efecto irrelevante
para los fines o resultados de la medicin que influye sobre la falta de
confiabilidad de tal medicin. El error es de dos tipos:
a) Error constante (sistemtico), que se produce cuando las mediciones que se
obtienen con una escala son sistemticamente mayores o menores que lo que
realmente deben ser.
b) Error causal (al azar o no sistemtico), que se produce cuando las medidas
son alternativamente mayores o menores de lo que realmente deben ser. Este
ltimo tipo de error interviene cuando se afecta la confiabilidad de un test
PSICOMETRIA
psicomtrico. Este error tiene que ver con la salud, fatiga, motivacin, tensin
emocional, fluctuaciones de la memoria, condiciones externas de luz, humedad,
ventilacin, calor, distraccin por problemas del momento, familiaridad con la
prueba, que presenta el examinado al momento de dar el test.
FACTORES QUE PUEDEN AFECTAR LA VALIDEZ Y CONFIABILIDAD

Dentro de los factores que pueden afectar la validez y confiabilidad tenemos:
La improvisacin, al hacer un cuestionario sin mucha dedicacin ni revisin
La utilizacin de instrumentos extranjeros no validados de acuerdo al contexto
EL instrumento resulta inadecuado para las personas a las que se la aplica
Las condiciones en las que se aplica el instrumento
Las instrucciones deficientes
Quienes aplican el instrumento no generan empata ni conocen el instrumento.

Validez y Confiabilidad de Un Test

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Validez y Confiabilidad de Un Test

Caricato da

Copyright:

Formati disponibili

PSICOMETRIA

Realice un informe acadmico sobre la importancia de la validez y confiabilidad

UNIVERSIDAD PRIVADA TELESUP

mide lo que el investigador

procedimiento para que el proceso de enjuiciamiento de los reactivos

Define especficamente el dominio del contenido por medio de una

Define, si fuera necesario, subcategoras importantes del dominio,

UNIVERSIDAD PRIVADA TELESUP

Emparejamiento de tems y objetivo/s o dominio/s, a juicio de los jueces. En

UNIVERSIDAD PRIVADA TELESUP

hiptesis acerca de cmo dos

grupos de individuos que difieren en ciertos aspectos, tambin

UNIVERSIDAD PRIVADA TELESUP

sobre conceptos que estn

Se establece y especifica la relacin terica entre los conceptos

Se correlacionan ambos conceptos y se analiza cuidadosamente

Se interpreta la evidencia emprica de acuerdo a que tanto clarifica la validez de

La validez se refiere a la adecuacidad de la interpretacin de los resultados

La validez es una cuestin de grado. No existe en trminos absolutos. No se

UNIVERSIDAD PRIVADA TELESUP

La validez se refiere siempre a un tipo de uso o interpretacin especfico. No se

La validez es un concepto unitario. No se puede hablar de diferentes tipos de

Para hablar de validez se requiere un juicio evaluativo comprensivo que

Suele determinarse un procedimiento estadstico

denominado Anlisis de Factores

TAMBIN: Slidos conocimientos estadsticos y Programas apropiados de

UNIVERSIDAD PRIVADA TELESUP

UNIVERSIDAD PRIVADA TELESUP

RELACIN CON EL CALIFICADOR: Dos expertos califican los resultados

EN EL CURSO DEL TIEMPO: El investigador obtiene valores diferentes al

EN RELACIN AL CONTENIDO DE LA PRUEBA: Muestreo o seleccin de los

TEST RE-TEST O MEDIDA DE ESTABILIDAD: El investigador debe aplicar el

TEST PARALELOS O MTODO DE FORMAS ALTERNATIVAS: Se administran

DIVISIN POR MITADES O MITADES PARTIDAS: Requiere slo una

UNIVERSIDAD PRIVADA TELESUP

Correlacin de Spearman Brown es igual al Coeficiente de Confiabilidad.

TCNICA KUDER RICHARDSON O COEFICIENTE KR-20: Permite calcular

UNIVERSIDAD PRIVADA TELESUP

FACTORES QUE PUEDEN AFECTAR LA VALIDEZ Y CONFIABILIDAD

La improvisacin, al hacer un cuestionario sin mucha dedicacin ni revisin

La utilizacin de instrumentos extranjeros no validados de acuerdo al contexto

EL instrumento resulta inadecuado para las personas a las que se la aplica

Las condiciones en las que se aplica el instrumento

Las instrucciones deficientes

Quienes aplican el instrumento no generan empata ni conocen el instrumento.

UNIVERSIDAD PRIVADA TELESUP

Potrebbero piacerti anche