Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Carmen Voces
UNED
PSICOMETRA
GRADO
R
RE
ES
SU
UM
ME
EN
N TTE
EM
MA
A 66:: V
VA
ALLIID
DE
EZZ D
DE
E LLA
AS
S IIN
NFFE
ER
RE
EN
NC
CIIA
AS
S ((II))
INTRODUCCIN
INTRODUCCIN
Los instrumentos elaborados para medir variables psicolgicas (constructos tericos, variables latentes o atributos psicolgicos) por
medio de indicadores (conductas que representan algn aspecto de ese constructo) han de cumplir una serie de requisitos para que
puedan ser utilizados con las suficientes garantas de calidad, entre estos requisitos hay dos fundamentales: que proporcionen
medidas fiables a partir de las cuales se puedan hacer inferencias vlidas.
La fiabilidad de las medidas (tema 4) hace referencia al grado en que las puntuaciones obtenidas al aplicar los tests a un sujeto, o
muestra de sujetos, reflejan su nivel real en el rasgo, o caracterstica medida; es decir, el grado en que esas puntuaciones estn
libres de errores aleatorios presentes en cualquier proceso de medicin. La validez de las inferencias que se pueden hacer a partir
de las puntuaciones obtenidas por los sujetos al aplicarles el tets se refiere al grado de relacin que se puede establecer entre la
evidencia emprica obtenida y el concepto terico que se tiene del constructo que se intenta medir. Por muy fiables que sean las
medidas que proporciona un test, si stas no se refieren a aquello que se quiere medir difcilmente se podrn interpretar las
puntuaciones obtenidas.
CONCEPTO DE VALIDEZ
Aunque es difcil dar una definicin concreta acerca del concepto de validez, convencionalmente y en relacin con los tests, se
acepta que el trmino hace referencia al grado en que el test mide aquello que pretende medir. En este sentido, un test ser
vlido para medir razonamiento espacial si mide este tipo de razonamiento y no otra cosa. Ahora bien, cuando decimos que un test
mide razonamiento espacial surgen una serie de interrogantes: mide realmente eso?, en qu grado lo mide?, mide slo eso?, el
intentar dar solucin a estos interrogantes forma parte de los estudios de validacin de los test.
(1) Validez referida a un criterio externo:
Validez predictiva de los tests: la capacidad del test para predecir un criterio externo, entendiendo por criterio, un
constructo terico. La operativizacin de la relacin entre el test y el criterio se efecta mediante un coeficiente de
correlacin. As, un test ser vlido en la medida en que exista correlacin entre las puntuaciones obtenidas por los sujetos
en el test y las obtenidas en el criterio externo seleccionado.
Validez concurrente. Para examinar la validez concurrente de un test tambin es necesario acudir al anlisis de su
correlacin con un criterio externo, no obstante, se diferencia de la validez predictiva en que la recogida de la informacin
tanto del test como del criterio se hace simultneamente. (Hay veces que se puede obtener la medida del criterio con
anterioridad a la del test; en este caso se habla de validez retrospectiva).
(2) Validez de contenido: un enfoque de la validez relacionada con criterios internos al propio tests. Este tipo de validez se centra
ms en qu es lo que mide el test que en su utilidad para predecir otras variables.
(3) Validez de constructo: este tipo de validez implica recoger toda la informacin necesaria para poder tener garanta suficiente de
que las conductas observables que se han elegido como indicadores del constructo que se quiere medir, lo son realmente. Parece
haber un acuerdo ms o menos generalizado en que, desde el punto de vista cientfico, la nica validez que se debe considerar es la
validez de constructo y que las otras dos, la de contenido y la relativa al criterio, quedaran incluidas en sta y seran consideras
estrategias de validacin para comprender mejor lo que mide un test.
VALIDACIN DE CONTENIDO
OBJETIVO
El objetivo que se persigue al llevar a cabo un estudio de validacin de contenido es analizar hasta qu punto los elementos o
tems que componen el test son una muesta relevante y representativa del constructo sobre el que se van a realizar las
inferencias. Al hablar de relevancia nos estamos refiriendo a la necesidad de una clara y exhaustiva especificacin de todas las
posibles conductas observables que son representativas del constructo a medir (especificacin del dominio de conductas). Al hablar
de representatividad se hace referencia a la necesidad de que todas esas conductas estn representadas en el test
(representatividad del dominio). El contenido de un test ser relevante si todos los tems del test miden algn aspecto del dominio
especificado, y ser representativo si los tems son una muestra representativa de todos los componentes especificados, es decir,
una muestra representativa del dominio.
PROCEDIMIENTO
La forma tpica de llevar a cabo un estudio de validacin de contenido, es utilizando un grupo de expertos que sern los encargados
de analizar dos aspectos fundamentales: (a) Que el test no incluya aspectos irrelevantes del dominio de inters y (b) Que incluya
todos los elementos importantes que definen el dominio. Se trata de hacer un anlisis racional del contenido del test y, por lo tanto,
los resultados del estudio estarn basados en los juicios subjetivos emitidos por los expertos.
1
Eleccin
mltiple
Frases
incompletas
Eleccin mltiple
R. abstracto
R. numrico R. espacial
Frases incompletas
R. abstracto
R. numrico R. espacial
R. numrico
(0,95)
R. espacial
0,20
(0,90)
R. abstracto
0,30
0,28
(0,92)
R. numrico
0,90
0,31
0,40
(0,93)
R. espacial
0,26
0,87
0,33
0,37
(0,94)
R. abstracto
0,43
0,20
0,84
0,26
0,37
(0,88)
R. numrico
0,79
0,27
0,31
0,77
0,15
0,33
(0,89)
R. espacial
0,11
0,68
0,22
0,24
0,67
0,31
0,19
(0,93)
R. abstracto
0,19
0,18
0,50
0,19
0,33
0,72
0,41
0,30
R. abstracto
(0,64)
Razonamiento numrico
Razonamiento numrico
Razonamiento numrico
Razonamiento espacial
Razonamiento espacial
Razonamiento espacial
Razonamiento abstracto
Razonamiento abstracto
Razonamiento abstracto
Factor 1
0,86
0,75
0,92
...
...
...
0,42
0,51
...
Factor 2
...
...
...
0,82
0,74
0,63
0,33
...
0,54
Correlacin de Pearson: tanto el test (X) como el criterio (Y) son dos variables cuantitativas continuas
rxy =
(2)
[NX
NXY XY
2
][
(X )2 NY 2 (Y )2
X p Xq
Sx
pq
y
rb =
Xp X
Sx
p
y
Donde:
X p = media en X de los que obtuvieron un 1 en Y
X p Xq
Sx
pq
rbp =
Xp X
Sx
p
q
Donde:
X p = media en X de los que obtuvieron un 1 en Y
Correlacin Phi (
): X e Y son dicotmicas
cd ad
Donde:
a, b, c y d representan el nmero de personas de la muestra cuyas puntuaciones en X y en Y son respectivamente: (0,1) (1,1)
(0,0) (1,0)
X
Y
0
1
0
a
c
1
b
d
bc ad
(a + b )(b + d )
pq
y
Donde:
a, b, c y d representan el nmero de personas de la muestra cuyas puntuaciones en X y en Y son respectivamente (0,1) (1,1)
(0,0) (1,0)
p y q = proporcin de personas que obtuvieron un 1 y un 0 respectivamente en Y
y = ordenada que en una distribucin normal corresponde a la abscisa que divide el rea total en dos pares iguales a p y q
(6)
Correlacin tetracrica: tanto la variable X como la Y son variables continuas que se han dicotomizado artificialmente. El clculo de
la correlacin tetracrica requiere la solucin iterativa de una serie de potencias que incluye las potencias de r. Su clculo es muy
laborioso, pero se han ofrecido algunas aproximaciones muy sencillas, la ms utilizada es calcular la razn bc/ad y consultar la tabla
correspondiente que se ofrece al final del libro. Si la razn es menor que la unidad se debe usar la recproca ad/bc para consultar la
tabla, en este caso la correlacin ser negativa.
bc
ad
Donde:
a, b, c y d representan el nmero de personas de la muestra cuyas puntuaciones en X y en Y son respectivamente (0,1) (1,1)
(0,0) (1,0)
b = rxy
Sy
Sx
a = ordenada en el origen o trmino constante, que representa el valor pronosticado en el criterio (Y) cuando en el test (X) se
obtiene un valor cero.
Una vez calculado el valor de la pendiente se calcula el de la ordenada en el origen:
a = Y bX
Una vez obtenidos los valores de a y de b se puede obtener la ecuacin de la recta de regresin. Esta ecuacin puede venir dada por
tres tipos de puntuaciones: directas, diferenciales y tpicas
Ecuacin en puntuaciones directas:
Y = a + bX
Sy
Sy
Y ' = Y rxy
X + rxy
X
S
Sx
x
Y ' = rxy
Sy
Sx
(X X ) + Y
y ' = rxy
Sy
Sx
(X X )
y ' = rxy
Sy
Sx
Ecuacin en puntuaciones tpicas (obsrvese que en esta expresin la pendiente de la recta de regresin (b) es igual al
coeficiente de validez (rxy), puesto que las desviaciones tpicas de X e Y son 1):
Zy = bZx
1
Zx
1
Hasta aqu, hemos utilizado una muestra de sujetos a la que se les ha aplicado el test cuya capacidad predictiva respecto al criterio
se quiere validar; a estos mismos sujetos se les ha calificado en el criterio y, con todos esos datos, se han construido las ecuaciones
de regresin. Pues bien, la verdadera utilidad de esas ecuaciones no est en pronosticar las puntuaciones de estos sujetos en el
criterio, no tendra mucho sentido ya que conocemos las puntuaciones que realmente han obtenido, la verdadera utilidad est en la
posibilidad de pronosticar la puntuacin que obtendrn en el criterio otra muestra de sujetos, de las mismas caractersticas que la
muestra utilizada para la construccin de las ecuaciones de regresin, a partir de las puntuaciones que obtengan en el test. Mediante
la aplicacin de las ecuaciones de regresin obtenemos una estimacin puntual de las puntuaciones de los sujetos en el criterio.
A) La varianza residual o varianza de error y el error tpico de estimacin
El coeficiente de validez indica la eficacia del test o variable predictora para estimar el criterio. En la medida en que el coeficiente de
validez sea ms alto, la estimacin ser ms exacta; en el lmite, cuando el coeficiente de validez fuera la unidad, el valor estimado
coincidira con la puntuacin que realmente obtuvieran los sujetos en el criterio. Sin embargo, dado que nunca se alcanzan
coeficientes de validez perfectos (iguales a 1 en valor absoluto), la estimacin vendr afectada por el denominado error de
estimacin, la diferencia entre la puntuacin que ha obtenido un sujeto en el criterio y la que se le pronostica mediante la ecuacin
de regresin: E = Y Y. Con cada sujeto se comete un determinado error de estimacin
1.
A la varianza de todos los errores de estimacin cometidos con los sujetos de la muestra
seleccionada se denomina Varianza residual, Varianza error o Error cuadrtico
medio.
Esta varianza de error representa la variabilidad media de las puntuaciones de los sujetos
en el criterio respecto a la puntuacin que se les pronostica mediante la recta de
regresin.
2.
S y2x =
S yx =
(Y Y ')
(Y Y ' )
Cuando se utilizan las ecuaciones de regresin para hacer pronsticos se cumplen una serie de requisitos:
-
La media de las puntuaciones obtenidas por los sujetos en el criterio es igual a la media de las puntuaciones pronosticadas: Y = Y '
La suma de todos los errores de estimacin es cero, lo que implica que la media de los errores cometidos es cero: (Y Y ' ) = E = 0
La varianza de las puntuaciones obtenidas por los sujetos en el criterio (Y) es igual a la varianza de las puntuaciones pronosticadas (Y)
ms la varianza de los residuos o varianza error: S Y2 = S Y2' + S Y2X
A partir de esta ecuacin se puede averiguar la proporcin de la varianza de las puntuaciones de los sujetos en el criterio que
se puede explicar a partir de la varianza de las puntuaciones en el predictor (varianza de las puntuaciones pronosticas) y qu
proporcin no se puede explicar y corresponde a los residuos
Si dividimos todos los trminos de la ecuacin por la varianza de las puntuaciones del criterio
tendremos:
Ahora bien, en el segundo miembro de la ecuacin, el primer trmino representa la proporcin de la
varianza del criterio que se puede pronosticar o predecir a partir del test o variable predictora y es igual
al coeficiente de validez al cuadrado. Por tanto la expresin anterior se puede poner tambin como:
Y, a partir de ah, deducir otra forma de expresin de la varianza de error y del error tpico de
estimacin:
Cuando la escala que se utiliza es la de puntuaciones tpicas, dado que la desviacin tpica es la
unidad, la frmula del error tpico de estimacin es:
1=
S y2'
S y2
S y2x
S y2
S y2x
S y2
2
= 1 rxy
2 )
S y2x = S y2 (1 rxy
2
S yx = S y 1 rxy
2
S Z y Z x = 1 rxy
Una vez hecho este pequeo repaso, vamos a interpretar los resultados obtenidos en funcin de tres coeficientes.
Coeficiente de determinacin
Equivale al coeficiente de validez al cuadrado y representa la proporcin (o porcentaje) de la varianza
de las puntuaciones de los sujetos en el criterio que se puede pronosticar a partir del tests. Tambin
se define como la varianza comn asociado entre el test y el criterio.
Coeficiente de alienacin
2 =
C.D. = rxy
S y2'
S y2
Aunque la frmula es equivalente a la del error tpico de estimacin en puntuaciones tpicas, de cara a
la interpretacin de este coeficiente conviene saber que, en realidad, indica la proporcin que
represente el error tpico de estimacin respecto a la desviacin tpica de las puntuaciones en el
S yx
2
= 1 rxy
criterio. En la medida en que el error tpico sea ms pequeo que la desviacin tpica del criterio el C. A. = K =
Sy
coeficiente K ser menor. El valor del coeficiente K oscila entre 0 y 1, ser mximo cuando el
coeficiente de validez sea 0 y ser mnimo cuando el coeficiente de validez valga 1. El coeficiente de
S y2 x
2
alienacin al cuadrado es el complementario del coeficiente de determinacin y representa, por lo
= 1 rxy
S y2
tanto, la proporcin (o el porcentaje si se multiplica por 100) de la varianza de las puntuaciones de los
sujetos en el criterio que no se puede predecir a partir del test, es la proporcin de varianza error que
hay en la varianza de las puntuaciones de los sujetos en el criterio. El coeficiente de alienacin
representa la inseguridad, o el azar, que afecta a los pronsticos.
Coeficiente de valor predictivo
S
Es el complementario del coeficiente de alienacin y es otra forma de expresar la capacidad del test
2 = y'
C.V .P. = 1 1 rxy
para pronosticar el criterio ya que representa la proporcin (o porcentaje si se multiplica por cien) de
Sy
seguridad en los pronsticos.