Sei sulla pagina 1di 18

'

5i.i

interpreracron ae ius caiificaciones

contenida en la prueba, como en las situaciones de selecci6n o colocacion.


Puesto que este tip0 de calificaciones incluyen daros de validez directarnente
en el proceso de interpretacion de la prueba, la primrra etapa seri slernpre
la de reunir 10s datos necesarios de validez. Solo despuis de completar esta
etapa podemos ocuparnos de 10s mitodos para presentar las calificaciones.
Vunos a analizar dos t i p a de cahficaciones relactonadas con 10s rcsultados
globales: uno que indica la probabilidad d e diversos resultados globales
(cuadros de expectancia) y otro que hace una predicci6n sobre el nivel de
ejecucion en el critcrio. En nuestra opinion, la:, calificaciones relacion:~cias
con 10s resultados globales, a1 incluir datos de validez en el proceso d e
interpretacion de la prueba, tienen muchas cosas que 10s hacen recomendables sobre 10s otros tipos d e calificaciones, particularmente sobre 10s relacionados con normas.
DrspuCs d e analizar varios problemas de interpretacihn d e calificaclones (cahficaciones ~mprecisas,la equiparacion de calificaciones de pruebas
difercntes y las diferencias de calificaciones), esta parte .del libro concluiri
con ~ l g u n a reco~nendaciones
s
para comunicar las calificaciones de las pruebas
a o t r ~ spersonas. Evidentemente, no podemos hacer que 10s lectores se
conviertan en expertos en la interpretacih de pruebas: esto se logra s61o
niediante la prictica y el conocimiento del desarrollo humano y las tkcnicas
de asesoramiento. Lo que haremos es presentar algunas guias utiles para
interprrtar calificaciol~es. Esis indicaciones se pueden resumir brevernente:
en primer lugar, asegurarse d e que ;a persona sepa lo que significan sus calificaciones y como se utilizarin, y en segundo lugar, permitirle reaccionar
ante lo informacion presentada, con el fin d e aclarar su significado y sus
imphcaciones.

Brown, F. (1980) Medicin en

i Psicologa y Educacin. Mxico: El


Manual Moderno

CALlFlCAClONES RELACIONADAS
C O N LAS N O R M A S
Es probable que la rnayoria de los lectores de este libro no deterrninen
nunca la confiabilidad ni la validez d c una prueba. Sin embargo, e n algun
mornento de sus vidas, tendran probablemente la ocasi6n de interprerar
resultados en pruebas psicol6gicas o educativas. Esto p u e d e producirse en
su papel profesional de maestro, consejero o gerente d e personal o a1 interpretar las calificaciones d e las pruebas q u e hayan pasado 10s lectores mismos
o sus hijos. Asi, en esta seccion, vamos a ocuparnos d e 10s "c6mo" y 10s
"porqui" del desarrollo y la interpretacion d e las calificaciones d e las pruebas.
Antes de ocuparnos d e 10s diversos tipos d e calificaciones, sera conveniente tomar en corlsideraci6n quC informacion se deriva de 1;is calificdciones de las pruebas. Una calificaci6n individual en cualquier prueba sera
siempre una funcion de tres condiciones: su cornposicion genktica, su aprendizaje y sus experiencias antes d e la prueba y las condiciones de la situscibn
cie prueba propiamente dicha, Los tres aspectos desempefiarin u n papel
importante en la determinaci6n de su ejecucion. .4un cuando e s dificil
separar 10s c o m p o n e n t s geniticos y 10s d e la experiencia, las condicionrs
:s!nncis:iznLts d e 11n examen ~srFIIrsn q 1 1 ~; n e.k.c~ci.'::~ 112 :!::;I ~ : L ~ Z O I : . )
r?fle]e S L ! ~ czipr2cidxkr y ~_l.r2:teri.ti~2~. nc !2 ri:uaci6n p a r ~ i c u l xd;.l
esarnen.
;
!

Otro modo, quiza mas fructifero, d e ver las calificaciones de las pruebas
es en funcion de las conclusiones que puedan obtenerse d e ellas. Trcs prey n r a s son cruciales: 'Donde e s t i ahora la persona? ~ C b m oIlcgo a ese
punto? iCuales son las irnplicaciones para su conducta futura? E n otrrls
palabras, nos interesamos por la ejecucion actual del individuo. 10s factores
clue h m hecho que funcione a ese nivel y lo q u e se puede esperar q u e h a g
en el futuro. Si vernos las calificaciones de las pruebas solo a partir d e la
primera perspectiva - ;donde esti 61 ahora?- interpretarzmos las calificaciones de 13s pruebas sclo conlo una medida de la situation actual. No obsrante, esto es un punto de vista limitado, puesto clue la rnisma calificaci6n de
una prueba obtenida por dos personas puede significar cosas d i s ~ i n t a ~ .

i16

Calificaciones relacionadas con las nonnas

f Capltulo 1 U )

dependiendo de sus experiencias previas. Por ejemplo, una calificacibn


eievada en una prueba de vocabulario podria tener implicaciones distintas,
si la obtiene un nifio cuyos padres fueron profesores universitarios o un
nifio de las profundidades de 10s Montes Apalaches. Por ende, para poder
hacer interpretaciones significativas, deberemos tornar en consideration las
experiencias del kdividuo previas a la prueba.
La tercera pregunta - jcudles son las implicaciones de las calificaciones?- es, por supuesto, un aspecto de la validez. Aunque puede resultar
interesante saber quC caiificaciones obtiene una persona en una prueba en
comparaci6n con algun grupo, deseamos saber, casi siempre, quC implica
la calificaci6n para su conducta futura. Para hacer esta prediction (interpretacion), deberemos tener datos de validez. En resumen, la interpretaci6n
significafiva de las calificaciones de las pruebas requiem tanto medios para
expresar esas calificaciones (o sea, una escala) como datos de validez que
indiquen lo que mide la prueba.
CALIFICACIONES BRUTAS. ORIGINALES 0 DIRECTAS
Despues de administrar una prueba, las respuestas de un individuo
se comparan con una clave para obtener su calificacibn en la prueba. En
las pruebas de capacidades y rendimiento, las respuestas que figuran en la
clave son las correctas. En 10s inventarios de intereses y personalidad, las
respuestas incluidas en la clave suelen ser las opciones predominantes de un
grupo particular de criterio. TambiCn se pueden utilizar como calificaciones
otras medidas de ejecucion -por ejemplo, el nhmero de errores, la suma
de puntos en varios reactivos o problemas, el tiempo necesario para completar la prueba o la clasificacion. Cualquiera de esas calificaciones, obtenidrs direc:dinente a partir 3e !a prueba, sc dmomina calificaciones hrutas
u originales.
Es raro que las calificaciones brutas Sean significativas por si mismos.
So10 cuando una prueba cubre un universo definido explicitamente tendri
sentido una calificacion bruta. De otro modo, tendra que compararse con
las calificaciones obtenidas por individuos cornparables o con algbn estandar
definido, o bien, expresarlo en tirminos de alguna consecuencia o criterio.
Todos esos mitodos requieren que se transformen las calificaciones brutas
a alguna escala diferente. Puesto que la nueva escala se deriva de las calificaciones brutas mediante una transformation estadistica, sr dice que son
calificaciones transformadas o derivadas.
CALIFICACIONES DERlVADAS 0 TRANSFORMADAS
Hay diversas formas posibles .is clasificac.6n de las calificaciones
dcrivatias (ver, par ~jrii:pir;, k~~gc;Cl',:9?! s; Lyrtrdrr, i 9;;j. En nup.rt1.a

exposicion, vamos a utilizar las tres clases amplias: calificaciones relacionadas con normas, calificaciones relacionadas con el contenido y calificaciones relacionadas con las consecuencias.
Calificaciones relacionadas con Ias normas
Lo mis frecuente es que la ejecucion de un individuo se compare
con las calificaciones obtenidas por otras personas en un grupo de rcferencia pertinente, el grupo normativo. Este hltimo se compone d e personas
que cornparten ciertas caracteristicas con el individuo. Por e ~ e m p l o ,en
un examen en clase, el grupo normativo incluiri a otras personas que se
sometan a la misma prueba; en una prueba de inteligcncia, 10s niiips de la
misma edad; en las pruebas d e admisi6n a la universidad, 10s estudiantes
que piensen seguir estudios profesionales. Asi, el desarrollo de las calificaciones relacionadas con las normas implica: ( I ) identificar un grupo
pertinente de comparaci6n; (2) obtener las calificaciones en la prueba
de 10s miembros de este grupo y (3) convertir las calificaciones brutas a
una escala que exprese la ejecucibn como clasificaci6n relativa dentro de
ese grupo normativo.
El uso de calificaciones relacionadas con las normas hace hincapii
en que las mediciones psicol6gicas son mas bien relativas, que absolutas.
Como se menciono antes, en las mediciones educativas y psicol6gicas, es
raro que se disponga de normas o escalas absolutas. Asi mismo, en la mayoria de las situaciones, las diferencias entre individuos son mas importantes
o al menos mas interesantes que las similitudes. Estos dos factores argumentan la expresi6n de la ejecucion en tkrminos comparatives; o sea, en
escalas relacionadas con normas.
Calificaciones relacionadas con el contenido
Aunqne las mediciones psicolbgicas y educativas suelen estar relacionauaa

cull

I I V I I I I ~ , , =j

fi.~~;.;;:;.

;
I
;
;
: ~2::

.?lG:p!j~

nt

y p y y r i i ~ n r1:;

infn;-

acseada. Zonsiaaienos a un padre que habla con el maestro de sl!


hijo que cursa el tercer grado de primaria. El profesor seiiala que las habilidades de Juan para la aritmttica lo colocan enrre 10% superior de su grupo
escolar. Se trata de una interpretacion relacionada con las normas )I le
proporciona a1 padre informacibn valiosa. Sin embargo, el padre pudiera
preguntar: "iQu6 habilidades aritrnkticas ha Ilegado a dominar Juan?". En
este caso, el padre solicita una descripcion de la ejecucion del niRo en funcibn del contenido que ha llegado a dominar y n o en funcibn de su ejecucion
en relacion a sus compafieros d e clase.
Este ejemplo ilustra un segundo mktodo de informar sobre 13 ejecucibn en tirminos de destreza. Es obvio que estas calificaciones son valiosss
sobre todo en 10s ambientes educativos. Sin embargo, el desarrollo de
calificaciones relacionadas cou el contenido se ha llevado a csho con Ientitud. Una de las razones para ello es que este rnitodo reqtic-is una especimelon

218

Calificaciones relacionadas con las normas

(Captrulo 10)

ficacion precisa del universo de contenido (y habilidades). Esta tarea es


dificil, except0 en ireas rnuy circunscritas. Por ejernplo, es relativamente
facil delinear el dominio de "adicion de nhrneros de dos digitos"; pero
rcsulra mas dificil circunscribir el universo d e "capacidad para resolver
ecuaciones algebriiicas". El segundo problerna es el de definir un nivel
aceptable d e destreza. A primera vista, puede parecer sencillo el especificar
el nivel de destrcza esperado en aritniktica en un alurnno de tercer grado,
datla una descripcibn dcl dorninio. No obstanre, una ligera reflcxibn indicari clue el h i c o rnodo n o arbitrario d e hacerlo es en terniinos d e las habilidades ejercitadas que tienen tipicaniente 10s alurnnos d e tercer grado; por
supuesto, se tratara d e u n metodo normativo.
Cdificaciones relacionadas con las consecuencias
Una tercera posibilidad es la de expresar la ejecucion en funcion d e una
conducta o una calificacibn pronosticada. 0 sea que, en lugar d e interpretar
la calificacicin d e un individuo en una prueba de admisicin a la universidad,
diciendo que obtuvo calificaciones rnhs altas que 78% de 10s candidatos
a1 primer afio profesional, podriarnos decir que puede esperar obtener calificaciones d e B. 0 bien, a1 interpretar un inventario d e intereses, podrianios
decir que 10s intereses de una persona fueron sirnilares a 10s d e un rnidico.
En arnbos ejeniplos, hemos interpretado las calificaciones de las pruebas,
no corno clasificaciones relativas dentro d e un grupo, sin0 en funcibn de
alguna conducta d e criterio o alpuna consecuencia importante.
Las calificaciones relacionadas con las consecuencias tienen una ventaja importante sobre otros tipos de calificaciones: incluyen datos d e validez
en la interpretacion de la prueba. 0 sea que la interpretacion es esencialrnente una prediccibn d e la conducta futura. Para poder hacer esta prediccion,
necesitamos datos d e validez que indiquen que conductas se pueden predecir
a partir .!:- ]as caii:icacinv: d e la.. ; ; i i i ~ b ? ~?or
. supuesto. suelen ser datos
de validez relacionados con el criterio. Aunque estc metodo reyulere mas
trabajo, puesto que se deben realizar estudios de validez e incluir sus resultados en el procedimiento d r inrerpreracion de las calificaciones, da casi
siempre interpretaciones rnLs significatiws.
En resurnen, las calificaciones relacionadas con las norrnas indican la
ejecucion en funcion d e la clasificacion relativa del individuo d e que se trate
dentro de un grupo de cornparacion, las calificaciones relacionadas con el
contenido reportan la ejecucion en tbrminos del contenido o las Iiabilidades
adquiridas y las calificaciones relacionadas con las consecuencias expresan
la ejecucion en funcion d e una prediccion J e la conducta futura.' Toniando
I

Un m i t o d o rn6s coniun es el de rvrnar en consideruci6n dos tipos principales de


calificaciones las relacionadas con las normas y las relacionadas c o n 10s criterios
(Glaser. 1963). Las caljficacio~ics relacionadas con el criterio correspondicnte o
lo que denorninanios calificaciones de contenidc.

en cuenta estas distinciones, varnos a efectuar un anilisis m i s drtallado de


cada tipo de calificacion. Puesto que las calificaciones relacionadas con las
nornias se utilizan con mayor frecuencia nos ocuparemos primrramenrt: d r
ellos. Y puesto que la interpretacicin d e las calificaciones relacionadas con
nornias se hace sirmpre en relacion a un grupo normativo, vanios a ocuparnos del procrso d e elaboraci6n de grupos normativos, antes de present31
10s diversos tipos d e calificaciones relacionadas con las normas.

NORMAS

DE

GRUPOS

En la rnayoria de las pruebas, se interpretan las czlificacionrs cornpnrando la ejecuci6n d e un individuo con la de 10s otros del grupo norniativo.
El grupo norrnativo proporciona una base d e c o m p a r a c i h que muestra las
calificaciones de un grlnpo estindar, definido, d e referencia. Potencialn~elite,
hay cierto nurnero de posibles grupos normativos para cualquier prueba.
Puesto que la clasificaci6n relativa de una persona puede v a r i x mucho,
dependiendo del grupo normativo q u e se utilice para la comparaci611, la
cornposici6n del grupo norrnativo es un factor crucial para la inrrrpretacion
de las calificaciones relacionadas con las norrnas. Asi pues, 31 desarrollar
nornias, la prirnera pregunta que debemos hacernos es: jcudles son 10s
diversos grupos normativos posibles?
Desde el punto de vista de quien desarrolla la prueba, la prcgunra es:
'En q u i poblaciones se utilizari la prueba? Los grupos nonnutivos se Jeben
elegir para representar esas poblaciones. Si la prueba e s t i disefiada para
evaluar las aptitudes d e 10s alurnnos de la preparatoria, para realizar las
labores correspondientes en la universidad, el grupo normativo deberri con-;-*.,;: G ; i < L i < ~ s 23 p;3p& i&:Gi;i ;<;
p.---- ,.";-*;,.
1,,"
-;A.,A
L,ou..
-... -.-.--...
si
la pr3eb.i se ~iisrfizpar:. neak ias c 3 r a c ~ r r i s ~ i c ade
s la personalidad de 10s
adolescenres, el grupo normativo consistiri en una seccion de corte transversal de adolescentes. Si la prueba se Jiscfia para medir 13 disposicibn
para la lectura de 10s alumnos de jardines d e nifios, el grupo norniativo
debt: consistir en alurnnos de kinder que no hayan comenzndo a recibir
rodavia instruction c.e lectura. Puesto que la mayoria d e las pruebas s r
disellan para utilizarse con varios grupos, se necesitara p o r lo c o m h n m i s
de un grupo normativo.
JLJIY

<.

""..,LA*

..,.3-

A-

Los usuarios d e las pruebas observan las normas desde diferrntes


puntos de vista, segun las ventajas que ellos consideran. Su pregunta primordial es: i C u i l d e 10s grupos normativos disponibles es mris apropiado'.'
Una vez mas, pueden ser pertinentes varios grupos normativos. P o r ejernplo,
a1 aconsejar a un ulumno de preparatoria q u e piense estudiar injynieri.1
e n la universidad, un asesor academic0 puedc coniparar las calitic;~cionc.s

del estudiante en una prueba de aptitudes escolares con las de otros graduados de preparatoria que piensen asistir a la universidad, con las de quienes
ingresan a las universidades a las que piensa asistir el alumno y con 10s de 10s
estudiantes de primer afio d e ingenieria en esas mismas universidades.
Tanto para quien desarrolla la prueba como para el usuario, la consideracibn principal es la composici6n de 10s grupos normativos. Para las
pruebas d e aptitudes y rendimiento, el grupo normativo apropiado consiste,
generalmente, en 10s competidores existentes y potenciales. Para las pruebas
de capacidades generales o caracteristicas d e la personalidad, 10s grupos normativos se componen habitualmente d e personas d e la misma edad o el
rnismo nivel educativo. Por supuesto, en cualquier situacion dada, se puede
usar una gran variedad de dimensiones para d e f i i r el grupo normativo
-tales como el sexo, la edad, el grado o el nivel educativo, la ocupaci6n, la
zona geografica, la posici6n socioeconbmica y la raza.

REQUISITOS DE LAS NORMAS DE GRUPO


Quien desarrolla o utiliza una prueba debe tomar en consideracion
varios factores a1 construir o evaluar grupos normativos. El primer requisito
es el de que la composition d e las normas de grupo se defina con claridad.
Aunque las especificaciones generales d e 10s grupos normativos seri:n determinadas por las finalidades y 10s usos d e la prueba, dentro de esta gama hay
una gran variedad de grupos normativos potenciales. Por esto, es necesaria
una descripcion concisa y clara de la naturaleza y las caracteristicas d e cada
grupo norinativo. Es insuficiente una aseveracibn en el sentido d e que un
grupo normativo se compone de "5,000 alumnos d e primer ailo d e profesional". lncluso la declaracibn que sigue proporciona solo una descripcion
minim.a:

-.

cl

glupo lwllllarivu

, -

CSLO A U I ~ ~ L O U~ V V

i&yi

165

dii;irii~~
d i 2:i;;l~: afh,

~iiujcsi~
illx.t;;\jj a iUrSOS dr. artes liberales en universidades
fundadas por concesidn de tierras.

IIUI~!V!CS

Algunas d e las preguntas que podemos hacer son: ~ Q u Ces un "alurrno


de primer afio"? iQu6 cursos se incluyen en "artes liberales"? i Q u t son las
C J
: universidades "fundadas por concesion de tierras"?
G Z i
;
Si un grupo normativo se compone de personas de un empleo o una
c ,e ,5
"-, 2 i; ocupacion especifica, se debera dar el titulo del empleo junto con su codigo
1
5 del (Dictionary of Occupationnl Titles) Diccionario de titulos de ocupa',
C - d E
s ; ciones, se deberin especificar 10s deberes del empleo y el tipo de empresa
$ 0 industria, su ubicacibn peogrifica, lor ailos de experiencia de 10s trabaja3
dores y otras informaciones pertinentes. Para las pruebas de ejecucion, la
i
2
information bisica debe incluir el nivel de estudios d e 10s alumnos, la posiI ; r *
cion socioecon6mica y otros datos demogificos y la experiencia d e 10s
f
alumnos en el area acadimica que se e s t i examinando.
I

4
B

sc:

Con frecuencia, varios grupos distintos d e una p o b l a c i o ~ i tiene una


ejecucion diferente en una prueba. Si 10s subgrupos tienen diferentes rangos
o niveles de ejecucion, se deberan construir normas separadas para cada
subgrupo. Por ejemplo, 10s hombres suelen tener e n general una mejor
ejecucion que las mujeres en pruebas d e aptitudes mecanicas, niientras
que, a la inversa, las n~ujeresobtienen calificaciones m i s altas q u e 10s hornbres en pruebas d e aptitudes secretariales; p o r esto, se suelen proporcionar
datos normativos separados para hombres y mujeres e n esas pruehas. Las
variables que se relacionan con frecuencia con la ejecucion en la prueba y
que, por lo tanto, pueden constituir la base para grupos normativos separados incluyen el sexo, la edad, la educacibn, la posicibn socioeconornica,
la inteligencia, la ocupacibn, la region geogrifica, la raza y la cantidad dz
adiestramiento especial.
En la mayoria de 10s casos, un grupo normativo consiste en u n a niuzstra tomada de la poblacion de interks, y n o de la poblacion total. Asi
pues, un segundo requisito es el de q u e el grupo normativo sea una rnuestra
representativa d e la poblaci6n designada. Por ejemplo, si se d e b e utilizar
una prueba en estudiantes de secundaria, se deben incluir numeros proporcionados de alumnos de cada nivel de graduation, las zonas urbanas y
rurales, las diversas razas, las posiciones socioecon6rnicas altas y bajas,
las diversas regiones del pais, etc. El no obtener una muestra representativa hari que se desvien 10s datos normativos, lo q u e complicari la interpretacion de las calificaciones. Puesto que 10s datos normativos son nias
ficiles de obtener para ciertos grupos (por ejemplo, e s m b facil obtener
datos d e escuelas suburbanas de a k a posicibn socioecon6mica q u e d e escuelas de barriadas bajas y mucho m i s sencillo el obtener d a t o s d e estudiantes
universitarios que d e adolescentes de 18 afios d e edad y q u e trabajan), esti
siempre presenta la posibilidad d e un muestreo desviado.
En el tercer piriafo va implicito un tercer r e q u i ~ i t o :el p r o e < i n ~ + n t c ?
.. . r"alil vvivcr rc nucbtro, cjcl111rio
i; d i L i d ~ ~ c r cull
k i ~ualruau.
naieriul, ia i k s c r i p c i c ~ aei mdcstreo y , p a r w d z , del grupo normativo.
yodria ser:

2: x:es:;c;

El grupo normativo consistia en 5,000 alumnos de primer afio a 10s que se


sonletib a la prueba durante la primera semana de clases, en septiembre de
1975; 250 estudiantes (125 hombres y 125 mujeres) se ercogieron al azx
de 10s alumnos inscritos en 10s cunos de artes liberales en 20 un~versidades
seleccionadas en forma aleatoria de entre todas las instituciones fundadas
por concesibn de tierras.
A1 igual que en CI caso de la descripcibn de la poblacibn, c u a n l o nilis
precisa y complcta sea la descripcion, tanto mejor.
Un cuarto requisito es el de que 10s grupos normativos se basen en una
nwestra d e tamalio adecuado. No obstante, cs muy dificil dcfinir con
precision lo que constituye un "tamafio adecuado". De t o d o s niodos, puesro
que la cantidad de error d e muestreo varia en proportion invcrsa a1 tarnu13

.
317

I L L

Calificaciones relacionadas con las nonnas

(Capiruiu

Califiraciones relacin~lldnscon las nonnas

iu^;

de la muestra, esta ultima seri mejor cuanto mayor sea su tamaiio. Desde
luego, n o es irrazonable esperar que las normas nacionalcs sobre pruebas
nornializadas incluyan varios centenares de casos en cada casilla d e muestreo.
Sin embargo, la necesidad de muestras grandes, q u e proporciona estimaciones mas estables, se debe suavizar mediante el requisito de que las muestras Sean representativas. 0 sea que, en general. es mas conveniente obtener
calificaciones d e una muestra mas representativa y d e tamaiio menor, q u e d e
una muestra mayor, per0 poco definida (ver una exposicion sobre 10s procedimientos d e obtenci6n d e grupos normativos, en la obra de Angoff, 197 1a).
Otra considrracion final es la de lo recientes que Sean las normas.
Con 10s cambios ripidos en la educacibn y 10s requisitos para 10s ernpleos,
las normas desarrolladas hace cierto nbmero de aRos pueden no ser apropiadas ahora. Puesto q u e se presentan en la actualidad cirrtos conceptos
a ni\lelcs de grsduacion mas bajos, 10s alurilnos actuales sc han expuesto
a materjales inis nunierosos y diferentes que sus equivalentes de 10s aiios
anteriores. Algunos requisitos d e trabajo han cambiado radicalmente, igual
que las capacidades d e 10s trabajadores. Las normas se deben actualizar
periodicamente y se deben abordar las normas antiguas con el escepticismo
apropiado.

NORM AS LOCALES
Un usuario d e una prueba puede descubrir q u e ninguno de 10s grupos
~lormativosdisponibles se ajusta a sus fines. 0 bien, puede desear utilizar
LIII grupo normativo m i s limitado que 10s presentados en el manual d e la
prueba, q u e suele tener un alcance bastante arnplio. Por ejemplo, un maestro
de escuela puede desear comparar la ejecucion d e sus a l u n ~ n o scon el d e
attron rsruiliantes de su clase o del A:eiria ed~lcarivclocal. En esta situacibn,
2::. A t las soluciones cs la construction de nornias locales.
El desarrollo de normas locales es sencillo y direct0 (Ricks, 1971).
Pursto q u e 10s cuadros de normas son bisicamente distribuciones d e frecuencias, el procedimiento implica la obtencion de calificaciones para
todas las personas del grupo local ( o una muesua de este grupo), el compilar
una distribucion de frecuencias y calcular las calificaciones derivadas (ver
niis adelante). Con los equipos d e procesainiento d e datos que existen en
la actualidad, se trata de una tarea sencilla, incluso cuando se incluye gran
cantidad de personas; si se hacc a mano, la tarsa n o es tarnpoco abrurnadora.
Por supuesto, la ventaja principal de las norrnas locales es q u e permiten
13s coniparnciones entre una persona y sus asociados inrnediatos. Puesto q u e
cada clase, compuiiia o r s c u ~ l aes unica en algunos aspectos, sus nliembros
w i n distintos d e 10s grupos normativos incluidos en el manual Ya q u e la
rjccucion en la j m e b a del grLpo local puede ser difersnte de la de 10s grupos
i:ormri;:os ::ncionii:rr.. la dc!r:.:.:tlttlsia de 10s bltirnos puede conducir a

223

inferencias inadecuadas, a1 interpretar las calificaciones. Por ejemplo, 10s


alumnos de cualquier clase o escuela dada n o tendrin las mismas experiencias educativas que 10s estudiantes d e un grupo norniativo nacional. Tambien es probable que 10s estudiantes locales difieran del grupo normativo
nacional en factores relacionados con el rendimiento en la escusla, tales
como el d e las capacidades o el nivel socioeconon~ico. C u a n d o esss difrrencias se producen entre grupos normativos locales y nacionales. un grupo
ilormativo local puede representar una mejor norma d e cornpar3ci6n. P o r
supuesto, el usuario d e una prueba puede utilizar tanto n o r m a s locales c o m o
nacionales y extraer la cantidad mixima d e inforrnacion d e las c:rlificaciones
d e las pruebas.
La ventaja d e las normas locales -proporcionar un g u p o d e comparacion mas pr6xirno- es tambien su mayor debilidarl. A u n q u e las nornlas
locales proporcionan informacibn pertinente para ]as decisiones loc:~les
directas, n o permiten las interpretaciones en un conrexto mas amplio. Por
ejrmplo, 10s datos de grupos locales pueden scr niis valiosos para ayudar
a 10s alunmos a que tornen decisiones sobre si estudiar Geomrtria A o
Geomerria B ; tendran poca utilidad para aconsejar a 10s alumnos sobre 13s
posibilidades d e q u e sigan una carrera en matemhticas. En el ultimo caso,
las normas mas amplias proporcionarin una mejor informaci6n.
Nuestra exposicion sobre las normas se puede resumir mejor citando
varios principios generales forrnulados por Seashore y Kicks ( 1 950). Sugieren que se debe: ( I ) utilizar grupos normativos bien definidos y evitar las
normas poco definidas d e 10s individuos en general; ( 2 ) usar normas d e
subgrupos separados, cuando las poblaciones Sean diferentes y mezclar
grupos so10 cuando su combinaci6n tenga sentido; (3) sefialar todos 10s datos
normativos utilss ( o sea, proporcionar normas sobre rarios grupos); (4)
desarrollar y emplear grupos normativos locales y especiales; (5) p o n e r todos
10s datos normativos a disposicion d e otros usuarios d e las prucbas y (6)
::i!iz-:
L-2 .'-rc~ nr\ymr,!i?rr\y (I-i:p?nih!y? ?.! jntprirrrtar :,.. ,-,~i~ricacjnr,es
..

LAS

CALIFICACIONES RELA'CIONADAS
CON

LAS

NORMAS

En esta seccion debernos analizar cuatro clases d e calificaciones relacionadas con las norrnas: percentiles, calificaciones estandar, escalas d e desarro110. indices y cocirn tes. Para cada calificaci6n, debemos t o m a r en consideracion su fundamento y su calculo, citar sus ventajas y limitaciones, d a r un
rjeinplo y describir c o m o se interpreta.

PERCENTILES
Es probable que el metodo rnis utilizado de expresion de las calificaciones de las pruebas sea el de 10s rangos percentiles. Los rangos percentilares de una calificaci6n se definen como el porcentaje d e personas del grupo
normativo que obtienen las calificaciones m h bajas. Asi, un rango percentilar de 7 8 indica que 78% de las personas en el grupo normativo obtuvieron
calificaciones mas bajas; un rango percentilar de 5 indica que so10 5% del
grupo normativo obtuvieron calificaciones rnis bajas. En otras palabras,
un rango percentilar indica la clasificaci6n relativa de la persona en porcentajes. Lo importante es que el rango percentilar incluye a porcentajes de
personas. Esto ofrece un contraste con las calificaciones de porcentajes, que
expresan la ejecucion en terminos del porcentaje, del contenido que se llega
a dominar; esto es, que una calificaci6n de 78% significa que el estudiante
responde correctamente a 78% de 10s reactivos.
Obtenci6n de 10s rangos percentilares
Para desarrollar rangos percentilares se requiere determinar la proporcion de personas del grupo normativo con calificaciones inferiores a una
calificaci6n especifica. La yrimera etapa consiste cn preparar una distribucion de frecuencias. A continuaci6n, se determina el nhmero de personas
que obtuvieron calificaciones inferiores a la calificacih particular en cuestion (la frecuencia acumulativa). La divisibn de este ndmero poi el ndmero
total de calificaciones que hay en la muestra da la proporcion de casos que
caen por debajo de la calificacion (la proporcion acumulativa). A1 multiplicar esta proporci6n por 100 las calificaciones se transforman en rangos
percentilares.
En realidad, el procedimiento no es tan sencillo. La razon es la de que
podemo: uszr la r:oporci6n d- personas con cdificaciones inferiores a ,una
calitlcacion dada o la proporcion de ios qut: ubtiencli ~ a i i i i c a ~ i uirgr ~ ~d i i
o inferiores a ella. En otras palabras, la trecuencia acurnuladlr se puede
definir en funcibn del limite inferior del inrervalo de calificaciones o el
punto medio de dicho interva1o.l Vamos a utilizar el ultimo metodo. En
el cuadro 10- 1 se da un ejemplo del cilculo de rmgos percentilares.3
La interpreracion de 10s rangos percentilares es directa. Lo unico
que se necesira recordar es que un rango percentilar indica el nhmero de

'

A veces se utiliza un tercer metodo, en el que se definen 10s percentiles en funcion del porcentaje de personar, que obtienen una calificaci6n dada o una calificacion inferior a ella. Las diferencias entre 10s tres mPtodos serin relativamente
pequefias, cuando haya un rango amplio de calificaciones; sin embargo, cuando
este rango de calificaciones posibles sea estrecho, habra diferencias relativamente
grandes entre 10s rangos percentilares, calculados por m6todos diferentes.
SI se desean otros m6tsdoi para cdcular 10s percentiles, ver las obras de Ebel(1972)
0 Ansoff ( 197 1 a).

personas de entre 100 que obtienen calificaciones mas bajas que la calificacion en cuestion. Como ilustracih, en nuestro ejemplo (cuadro 10- 1 ),
una calificaci6n bruta de 25 era equivalente a1 rango percentilar 31. Asi,
un alumno que obtenga una calificacion de 25 en el (American College
Testing Program) (ACT) Programa Estadounidense de Pruebas Universitarias
tendri calificaciones superiores a 31% de sus compafieros e inferiores a
6 9 8 de ellos.
Los rangos percentilares se pueden obtener tambiCn utilizando procedimientos graficos. Por ejemplo, podriamos trazar las frecuencias acumulativas y obtener una curva, llamada ogival. A partir de esa curva, podriamos
leer directamente 10s rangos percentilares. En la fig. 10- 1 se, ilusrra el
mod0 en que se hace esto, demostrando que una calificaci6n bruta de 25 es
equivalente a1 percentil 31. Esta clasificaci6n es la rnisma que se obtuvo
por el metodo de tabulaci6n (ver el cuadro 10- 1 ).
Pun tos percentiles
A1 determinar 10s rangos percentilares, buscamos la proporcion de
individuos con calificaciones rnis bajas que la calificaci6n dada en la prueba.
No obstante, deseamos a veces saber quC calificacion de una prueba divide
una distribucion en ciertas proporciones; por ejemplo, podemos desear
identificar a 20% superior de 10s estudiantes, para poder situarlos en una
seccion aventajada del curso. Para lograr esto, deberemos determinar la
calificacion de la prueba que corresponde a un rango percentilar de 60.
Esto se puede lograr, encontrando la proporcion acumulada asociada a1
rango percentilar y, a continuaci611, el punto de la escala de calificaciones
brutas que corresponde a esa proporcibn acumulada. El punto en la escala
de calificaciones que corresponde a una clasificacion deseada en percentiles
se denomina percentil.
Como ilustracihn, vamos a deterrninar la calificaci6n b m t a en nuestro
q i x i+i;* ,i2S;Z aurariul L;G ia disiribu&,r GG 605* isstar~ie.
En ei c-sdro :G-1 podemos ver que una calificacion brilta de 30 tiene una
proporcion acumulativa (PA) de 0.890 y una calificacion bruta de 29 tiene
una PA de 0.780; a1 interpolar, descubrimos que una calificacion bruta de
29.2 es equivalente a un rango percentilar de 80. Asi, 10s alumnos con
calificaciones superiores a 29 estarfan entre 20% superior d e su clase y
podran ser elegibles para la seccion aventajada.
:j;.;;.~;k,

Obstrvese que I~ubiCramospodido lltilizar tanibien el procedimiento


grifico para obtener percentiles. 0 bien, si desearamos so10 encontrar una
linea de corte, como en nuestro ejemplo, hubieramos podido contar el
20% de las caljficaciones (en el ejemplo, las 35 calificaciones suprriores).
Sin embargo, en general, nos interesan varios puntos percentiles. Por ejemplo, si queremos desarrollar un cuadro normativo (ver rnis adelante) que.
en lugar de mostrar rangos percentilares para cada calificacion bruta. presento las calificaciones brutas cue fueron necesarias para obtener diversos

---

7'76

Calificaciones relacionadas con las normas


Cuadro 10-1.

Calificaciones relacionadas con las nurmas

f Caplrulo 1 0 )

22 7

Obtenci6n d e 10s rangos percentilares

Las etapas q u e siguen ilustran 10s procedimientos para calcular 10s rangos
percentilares. Los datos utilizados son las calificaciones combinadas ACT
para una muestra d e 177 alumnas de primer ingreso, a una universidad de
Artes Liberales del oeste rnedio.
Pasos a seguir para el cornputo:
1. Preparar una distribucibn d e frecuencias d e las calificaciones.
2. Deterrninar la frecuencia acumulada ( F A ) a1 limite inferior de cada
calificacibn. Esto es la suma d e todas las calificaciones que se encuentran por debajo de la calificaclin en cuestion. Por ejemplo, la FA para
un resultado de 2 3 es: 1 3 + 1 2 = 16, el nhmero de estudiantes con
calificaciones d e 22 6 rnenos.
3. Deterrninar la frecuencia acumulada e n el punto rnedio del intewalo
de las calificaciones (FA,, ). Esto se obtiene sumando la mitad del
numero de calificaciones del intervalo a la FA. Por ejemplo, para una
calificacion d e 23:

4.

Determinar la proporci6n acumulada ( P A ) , dividiendo FA,,


el numero total d e calificaciones. Para una calificacibn d e 23:

por N ,

Calificacion bruta u original (combination ACT1


Fig. 10-1. MBtodo grhfico para obtener rangos percentilares (Nota: A l rrazar lineas
perpendiculares a 10s ejes, descubrimos que una calificacion b r u t a de 27 es equivalente a u n rango percentilar de 54).

rangos percentilares -tales como 9 0 , 8 0 , 70, etc. En este caso, c a l c u l 3 ~ i a m o s


puntos percentiles.

5.

Para deterrnina~10s rangos percentilares ( R P ) , se multiplica PA por


100. Una vez mas, con una calificacion d e 3-3, se tiene:

Un rango p e r r e ~ t i l a rde 13 sig!?ifica q u e 1 3 d e cada 100 estudlantes (1 3%)


~ u v i c l u lc~iiiibabiullcs
~
lrlclwics quc 23 cn la ACT y E7 de iada iG3 i87X;
:u:'lercn calificaciones mis altas.

FA

F A pm

PA

RP

Deciles
Los puntos percentiles dividen una distribucibn d e calificaciones e n
100 partes iguales. Sin embargo, e n nluchas cii-cunstancias, n o sc necesitan
esas distinciones tan fillas y puede bastar con la division d e la disrribucion
en un nulnero menor de segmrntos o porciones. De entre 13s divisiones
: , n 4 l > l t * ~l:>c
.

..-

r i A . i n ~ s c cc!., I?!

, , , , A~- ~,-*I
rlllilLC;I',~~
~ c.---.-..
~

.,..-

" 3 3 2

-...

'-am,,,lm-+r
.
'
.
.

,.,,..nyo.;..

-"a.

7---

.,.-...-.

.,crL.c..L,o.

que dividen la distribution en decimas

bc

Lc7S

(ic~~u~ninan

dzciles. Puesto que 10s deciles dividen la distribucion e n diez srgrnentos


iguales (cortindola en 10s puntos percentiles d e 10, 20, . . . , 9 0 ) . el cilculo
de deciles es igual q u e el d e 10s puntos percentiles 10, 2 0 , . . . . 9 0 . En
esencia, 10s deciles proporcionan una escala d e clasificacion en divisionrs
tic dicz, de tal modo que cada etapa contienc 10% d e las calificnciones.
Tradicionalmente. la decima m i s baja se denonlina primer decil. 13 sipuiente
es el segundo decil (clasificaciones en percentiles de I 0 a 70), y a s i sucesivamente.

Evaluation
La ventaja principal de 10s percentiles es su facilidad d e intcrpretacion. El conocer la clasificacion relativa d e una persona e n un g r u p o pertinrnte dl? comparacion es, para la nlaporia d e 10s individuos. un indice
de elecucibn simple, significativo y facil d e entender. T-mi-ikn. l u r a muchos

Calificaciones relacionadas con las nomas

22 9

CALIFICACIONES ESTANDAR

propositos la clasificacion dentro de un grupo es suficiente, por lo que no


se necesitan transformaciones mas complejas.
Los rangos percentilares tienen dos limitaciones importantes. En
primer lugar, siendo una escala ordinal, no se pueden sumar, restar, multiplicar o dividir. Esto no constituye una limitacibn importante a1 interpretar las calificaciones; per0 constituye una dificultad grave cn 10s andisis
estadisticos. Una segunda limitacibn tiene mayor interts para 10s usuarios
de las pruebas. Los rangos percentilares tienen una distribucibn rectangular,
en la que las distribuciones de las calificaciones de las pruebas se aproximan
en general a la curva normal. Como consecuencia de ello, las pequefias
diferencias de las calificaciones brutas cerca del centro de la distribuci6n
dan como resultado grandes diferencias en percentiles. A la inversa, las
grandes diferencias de las calificaciones brutas en 10s extremos de la distribucion producen solo pequefias diferencias en percentiles (ver la fig.
10-2). A menos que se recuerden estas relaciones, 10s rangos percentilares
se pueden malinterpretar con facilidad; en particular, las diferencias aparentemente grandes, alrededor del centro de la distribucibn tienden a interpretarse con exageracion.

Los rangos percentilares se miden en una escala ordinal. Por varias


razones, sobre todo cuando se realizan analisis estadisticos con las calificaciones de las pruebas, seria conveniente expresar las calificaciones en una
escala de intervalos -0 sea, tener una escala con unidades d e tamafio iguales.
Las calificaciones estandar poseen esta propiedad.
Una caIificaci6n estandar ( 2 ) es la desviaci6n que tiene una califimcion
bruta de la media, en unidades de desviaciones estindar:
7

=-

x-x
S

Puesto que la unidad basica de la escala es la desviacion estandar, se


dice que esas calificaciones son estandar.
Es precis0 indicar varias propiedades de las calificaciones estindar ( z ) :
( I ) Se expresan,en una escala que tiene una media de 0 y una desviacion
estandar de 1. (2) El valor absoluto de una calificacibn z indica la distancia
a la que se encuentra la calificacibn bruta de la media d e la distribucibn. El
signo de las calificaciones z indica si la calificaci6n cae por encima o por
debajo de la media; las calificaciones por encima de la media tendrin signos
positivos; 10s que se encuentren por debajo de la media, negativos. (3) Puesto
que las calificaciones estandar se expresan en una escaIa dr: inrervalos, se
pueden someter a las operaciones algebraicas comunes. (4) La transformacibn de las calificaciones brutas a estindar es lineal. Por esto, la forma de la
distribucibn de las calificaciones z es similar a la distribucion de las calificaciones brutas. Si la distribuci6n de las calificaciones brutas es normal, lo
sera tambiin la distribuci6n de las calificaciones z ; si la distribucion de /as
calificaciones brutas es sesgada, lo sera tambiin la distribucibn de las califi,?a:iones i. (5) Ci la distribucibn de las calificaciones brutas es normal. 10s
-2 z I 3.
rangos ae ias caiiGcaciones z iri rie apunilliodo~iitiii~
Para evitar decimales y valores negativos, las calificaciones z i r transforman por lo comun a otra escala. Esta transformaciun es de la forma:

Fig. 10-2.

en donde Z es la calificacion estandar transformada y A y B son c o n ~ t a n t e s . ~


Puesto que la suma o la multiplicacion de o por una constante n o destruye
las relaciones en la escala, las relaciones entre las calificaciones z seran las
mismas que entre las calificaciones brutas.

!,.

Percentiles
'#

Relaciones entre distribuciones :k calificaciones brutas y rangos percentilares.

Obsirvese que esla es la ecuacibn para una linea recta, e n d o n d e B es la constante


de inclinacibn y A la constante de intercepcibn. Tal y c o m a se aplica a nuestro
problems, A rransfonnnri la media y B la desviacibn eslandar.
I

Calificaciones relacionadas con las nonnas


Cuadro 10-2.

231

Aunque se pueden utilizar constantes d e cualquier tipo, el procedimient o recomendado (APA, 1974) es el d e utilizar la transformaci6n:

Obtencio11 de calificaciones estandar

Las etapas que siguen ilustran la forrna d e obtener calificaciones estindar.


Los datos son 10s utilizados en el cuadro 10-1.
Pasos para el computo:
1. C_alcular la media y la desviacion estindar. Para esos datos, obtenemos
.Y = 26.54 y s = 2.76.
2. Para cada calificacion bruta, determinar la calificaci6n de desviacion
individual (x), q u e es la calificacion bruta menos la mzdia. Por ejemplo,
cuando X = 25:

En esencia, esta transforrnacion cambia las calificsciones a una escala


que tiene una media d e 50 puntos y una desviacibn estindar d e 1 0 punros.
Se pueden liacer otras transforrnaciones, utilizando cualquier ~ n c d i ay cualquier desviacion estandar que sea apropiada y conveniente. En to-ios 10s
casos, las calificaciones se redondean a nbmeros enteros.'
En el cuadro 10-2 se dan un ejernplo del cilculo d e calificacioncs
estandar.

3.

4.

Deterniinen z para cada calificacion. Recuerden que z = xis. Para X =


25:

Calificaciones estandar norrnalizadas


La transforrnacion de calificaciones brutas a estindar, q u e \limos
antes, era lineal; p o r ello, la forrna d e la distribucibn d e las calificaciones
2 y las calificaciones brutas seri la rnisrna. Si la distribucibn d e las calificaciones estandar es normal, estas se pueden convenir directamenre en
rangos percentiles. Esta transformaci6n se puede liacer, utilizando un
cuadro de ireas de la curva normal, como la que se d a e n el Aptndice A.
Esta transforrnacion es posible, debido a q u e cn una distribucibn normal.
hay una relacion especificable entre las calificaciones esrindar ( 2 ) y las
areas situadas a lo largo d e la curva ( o sea, la proporcibn d e casos q u e caen
entrr dos puntos).

La calificacion 2 expresa la calificacion bruta en unidades de desviacion


estindar d e la media. En nuestro ejemplo se indica que una calificaci6n
original de 3 5 estd a 0.56 de desviacion estindar por debajo d e la media.
Para eliminar decimales y nunleros negativos, transfonnanios las calificaciones z a otra escala. La transformacion que se recornienda es a una
escala con una media de 50 y una desviacion estandar d e 10. Esto se
puede lograr, utilizando la f6rmula Z = 5 0 + 101. A1 aplicarlo a nuestro
ejemplo, con X = 25,

Nuestras calificaciones se expresan ahora en una escala de calificaciones


estrindar con una media d e 5 0 y una desviacion estandar d e 10 puntos.
T a rltrlna rlel c h t n p ~ ~ rzen t;~l)ulacomo sip-::

lncluso cuando las calificaciones brutas o directas n o e s t i n d i s t r i b u i d x


normalmente, podrernos realizar una transformacion d e area y forzar las
calificaciones a entrar en una distribucion normal. Las calificaciones obtenidas de este rnodo se dice que son calificaciones estindar normalizadas; la
palabra "norrnalizados" indica q u e se ha obligado a las calificaciones a entrar
?I? !!r?? ! ~ l r l r i ! ~ l l c i + ! ? .?pm?z!. Par? ! ! ~ . 3 2 ! i 7 n r 1:1c m l ~ f i r ~ ~ i c .. ~i ~
. .h rhnb?:
;:;ni;.n
b~.ii.pi;; :;;p;iiii que ]us calificaciones d e la caracterir,:i:c;.~r.st.
mide tienen, d e liecho, una distribucion normal. Si n o se puede suponrr
que las calificaciones tienen una distribuci6n nornial. forzarlas a entrar
a una distribucion normal solo serviria para distorsionar la disrribucion
inisma. Por consiguiente, las calificaciones estindar normalizadas se calculan solo cuando una distribucion obtenida se acerca a la normalidad
pero, debido a 10s errores de rnuestreo, es ligerarnente diferente. Esta situacion se presenta con frecuencia en la normalization d e pruebas e n muestras
grandes y heterogkneas. En el cuadro 10-3 se ilustra el procedimiento
utilizado para obtener calificaciones estandar norrnalizadas.
\

Esas transformaciones tienen tambien la ventaja de eliminar decitnales y valores


negativos (por ejemplo, en la escala de 50, 10, el rango esperado de resultados seri
de aproximadamente 20-80).

Cuadro 10-3.

Obtenci6n de caiificaciones estindar normalizadas

Las etapas que siguen ilustran el cilculo de las calificaciones estindar normalizadas. Los datos son 10s mismos que se utilizaron en 10s ejemplos anteriores (cuadros 10- 1 y 10-2).
Pasos para el cornputo:
1 . Para cada calificaci6n original, encuentre la proporcibn acumulada
(PA), mediante 10s procedimientos descritos en el cuadro 10-1.
2. En el cuadro de zonas de la curva normal (ver el apCndice A), encuentren la calificacion z comparable a esta PA. Para las calificaciones situadas por encima de la mediana (PA > 0.500) utilicen la columna marcada "Zona de Proportion Mayor"; para las calificaciones por debajo de
la mediana (PA > 0.500), usen la columna marcada "Zona de Proporcion Menor". Esto da la calificacion z que corta la distribucion en las
proporciones deseadas. Denominaremos este valor z', para distinguirlo
de la calificaci6n z calculadas mediante una transformacibn lineal
(corno en el cuadro 10-2). Para obtener valores de z', tendremos que
in terpolar.
3. Una vez mas, debemos transformar las calificaciones a otra escala y,
otra vez, vamos a utilizar una escala con una media de 50 y una desviacion estindar de 10; o sea, Z' = 5 0 + 1 0 ~ ' .
La rutina del cornputo se tabula como sigue:

PA

32
31
30
29

.989
.958
.890
.780

id

.oo I

27
26
25
24
23
22
21
20

.537
.4 1 5
.3 1 1
.209
.I30
.056
.014
.003

,* -

z'

Z'

2.29
1.73
1.23
0.77
6.4;
0.03
-0.21
-0.49
-0.81
-1.13
-1.59
-2.20
-2.75

73
67
62
58
54
51
48
45
42
39
36
28
22

Como sucede con todas las escalas de calificaciones estandar, se puede


utilizar cualquier media y cualquier desviacion cstandar arbit raria. Una
vez mas, el procedimiento recomendado es el de transforrnar las calificaciones a una escala con una media de 50 y una desviacibn estandar de 10
puntos. Por supuesto, si la situacion lo justifica, se pueden utilizar otras
const antes.
Otras caiificaciones estandar
Cuando se dan las calificaciones estandar normalizadas en una rscala
con una media de 50 y una desviacion estindar de 10, se denominan calificaciones T. Este uso puede provocar cierta c o n f u s i h , puesto q u e l a s calificaciones T se definieron originalmente en relacion a un grupo normative
dado (McCall, 1922) -no en un sentido genirico. Ademis, algunas personas
utilizan la designacion de "calificaciones T" para referirse a cualquier sistrma
de calificaciones estindar transformados, normalizados o no. Lo mas frecuente es que a cualquier sistema de calificaciones estandar normalizados con una
media de 50 y una desviacion estindar de 10 se le de el nombre d r sistema de
calificaciones T (Lyman, 197 1).
Otro tip0 de calificacion estandar es la estanina, que es una abreviacion de "nueve estindar". La escala estanina es una escala de calificaciones
estandar de nueve intervalos, con una media de 5 y una desviacion estandar
de 2 puntos. Cada m a de las nueve categorias de calificacion, con excrpcion de las dos categorias extremas, tiene una amplitud de media desviacibn
estindar (ver la fig. 10-3). La utilizacion de calificaciones de un solo
digito tiene ciertas ventajas; por ejemplo, las estaninas se pueden perforar
en una sola columna de una tajeta IBM. No obstante, como cualquier
otro sistema que reduce el rango mediante un agrupamiento, sacrifica cierta
precisibn a favor de la simplicidad.
-

1
:
urrr.p.rrur&u.a

-'

Nora: Si la distribucibn es normal, las calificaciones estindar normallzadas


(z' o 2 ' ) tendrdn el mismo valor, dentro de 10s errores de medicibn, como
las calificaciones estandar comparables transformadas de mod0 lineal (z o
Z, respectivamente). Si la distribucion no es normal, 10s valores comparativos diferirin.

..

!
..I..
.
u L ~u.1
L~AIAAULIV~IU~ G J I P ~ ~ U ~ .

-.
un2 calliicaclon z de 1.00, un z (o T ) de 60 y una caiiilcac15n estancisi
normalizado de 60 indican que la calificacibn bruta e s t i a una desviacion
estandar por encima de la media de la distribucion.' De mod0 similar, un z
de -1.50, un Z de 35 y una calificacion estindar normalizada de 35 representan una calificacibn de una desviacibn estiindar y media por debajo de
la media. Asi pues, las calificaciones estindar indican la posicibn relativa
de un individuo, en funcion de desviaciones estindar de la media.
Para una persona no familiarizada con el concept0 de des\.iacion estandar, esa interpretation, en el mejor de 10s casos. scri vaga. No obstante.
a1 utilizar calificaciones estandar normalizadas o cuando la dlsrribucion dr.
las calificaciones estiindar transformados linealmente se acerqur a la normalidad, las calificaciones estandar se podran convertir en ranpos percentilares con relacion a la CUNa normal. Asi, una calificacion estindar d r 60
es equivalente a un rango perce5tilar de 84 y uno calificacion estindar de

Chlificaciones relacionadas con las nonnas

~ J J

Otra ventaja de 13s calificaciones estindar es la d e clue p e r m ~ t e n13


comparaci6n directa de las calificaciones en dos o m h pruebas o escalas.
La transforinacion de las calificaciones en calificaciones estrindar corrigz
las diferencias en medias y desviaciones estandar de las diversas distribuciones, de modo que las calificaciones d e las diversas pruebas se encuentrzn
en la misma escala. En otras palabras, una calificacion z dada represrnra la
misma posici6n relativa en las dos distribuciones sean cuales s r a n la media
y la desviacion estandar de las distribuciones originalrs. Corno ilustracibn,
supongamos que la prueba A tiene una media de 4 0 y una desviacion estandar de 20, la prueba B tiene una media d e 5 0 y una desviacibn estindar
de 10 y que Juan obtuviera 7 0 en la prueba A y 65 e n la B , a1 convertir a
calificaciones estindar, descubririamos que su calificaci6n z seria el m i s ~ n o
(+ 15 0 ) en las dos pruebas:
Prueba A :

-=

20

1.50

Prueba B:

65 - 50
=

1.50

Asi pues. aun cuando las calificaciones brutas eron distintas en Ias dos
pruebas, sus calificaciones estindar eran iguales y, por esto, o b t u v o la rnisnia
posici6n relativa en las dos pruebas.

Fig. 10-3. Relaciones entre varias escalas cornunes de calificacibn. Estas relaciones
solo son validas cuando las calificaciones tienen una distribucion normal (Adaptada
de la obra de H.G. Seashore, Methods of Expressing Test Scores. Nueva York:
The Psychological Corporation, Test Service Bulletin No. 48, 19551.

35 rs t.clti:.,..-lentt. a tin railgo perieniilar d e 7. Estas relacianes entre las calificacionrr ectlnrlar y 10s rangos percentilares son vilidas. sea cual sea la
naturaleza y el contenido de la prueba. Asi, las calificaciones estindar normalizadas y las calificaciones Z se pueden convertir a percentiles e interpretarse con10 tales. Cuando iriterpretan las pruebas personas no familiarizadas con las calificaciones estindar, probablemente desearin utilizar una
interpretacion basada en percentiles.

Evaluation
Puesto que las calificaciones estandar expresan las calificaciones de las
pruebas en una escala de intervalos, son valiosos cuando se necesitan andisis
estadisticos posteriores; por ejemplo, cuando se tienen que combinar
varias calificaciones en una medida cornpuesta. Ademis, las calificaciones
estandar normalizadas permiten referirse a una distribucion estindar (la
c u m normal) a una conversi6n directa a percentiles, a mod0 d e sirnplificar
la interpretacion.

Los legos en la materia tienen mayores dificultades para entender las


calificaciones estindar, puesto q u e son m i s complejas, desde el p u n t o de
vista estadistico, y menos conocidos que 10s percentiles. TambiCn 10s
sistemas de calificaci6n estindar usan diferentes medias y desviaciones
estindar y , con frecuencia, se dice sinlplemente que son calificaciones estindar, sin hacer ninguna distinci6n entre las normalizadas y las transformadas
en forma lineal. Por consiguiente, el usuario d e una prueba d e b e asegurarsc
sicmpre del tipo de valores escalares usados en la escala dada y si las calificacione!: so11 no;lnalizr;2as o se trilta siinplenienre d c ulia 11.;11l~fzrl:1~:inl1
lineal IIP !2c c ? l i f i ~ a f i n n c hrutas.
~
Finalnlente, i n n o r m a l i z a c i h dz mliobliga a las calificaciones a entrar a una disrribucihi
fin.
~ ',
l.~ i o n eestiindar
s
normal. Este proczdilniento se justifica para suavizar 10s errores dz niucstrzo; de otro niodo, solo distorsionaria la forma de la d i s t r i b u c i h .
En la fig. 10-3 se muestra la relacion d e 10s percentiles y \.arias tipos
dc calificacionrs estindar utilizados comunmente. En esta figura se nlucstran las relaciones cuando la distribucion d e calificacionrs brutas sean
normales; naturalmente, las relaciones serian diferentes en las distribucionrs
no normales.

ESCALAS DE DESARROLLO
Muchas habilidades, capacidades y caracteris:iias se desarrollan dc
motlo sistc~ndtko2 travCs del t i c n ~ p o . Por cjc~nplo,12 xp;lci:!:~! d e leciura

236

Calificociones relacionadas con las n o m a s

de un niAo aumenta con la edad y 10s aiios adicionales de asistencia a la


escuela. Lo mismo sucede con la mayoria d e las d e m h habilidades y capacidades intelectuales. Puesto que esas capacidades aumentan sistemiticamente, se puedcn desarrollar escalas de calificaciones q u e cornparan la ejecucion d e un individuo con el de la persona promedio a varios niveles de
desarrollo. En estas escalas, una calificaci6n individual indica el nivel d e
desarrollo q u e caracteriza su ejecucicn. Como podia esperarse, las escalas
de desarrollo seiialan generalmence la ejecucion como equivalente a la edad
cronol~gicao a1 grado escolar.
Escalas d e edad mental
Alfred Binet, hacia fines del siglo, concibib la idea d e medir el crecimiento mental, a1 comparar la ejecuci6n de un nifio con el d e 10s niiios
promedio de varios niveles d e edades -0 sea, en reactivos en 10s q u e la ejecucion variaba sistematicamcnte con la edad. A continuacibn, cada reactivo
se situaba a1 nivel d e edad en el q u e la mayoria d e 10s niilos podian completar con Cxito esa tarea. Por ejemplo, si la mayoria d e 10s niiios de ocho
afios de edad deberan responder correctamente a la pregunta: "iCuanto
es nueve veces nueve?"; pero so10 pudieran responder bien menos de la
mitad d e 10s njfios de siete afios, esa pregunta se incluiria al nivel de ocho
aRos de edad. Mediante el desarrollo de cierto nhmero d e reactivos apropiados para cada nivel de edad, Binet construyo una escala q u e evaluaba
el nivel de desarrollo mental de 10s niAos. La calificaci6n q u e recibia un
niiio era el del nivel d e edad a u e calificaba mejor a su ejecucibn. Esa calificaci6n se denomina edad mental.
Todas las escalas de edad mental se desarrollan utilizando esencialmente el mismo razonamiento y 10s mismos procedimientos. Estas escalas
asipnsn una calificaciin a un individuo, comparando su ejecucion con la
ael nino pru~netiiu6s i i r ~ r a d ad i i c ; . Dzr :;t.:pl~.,
..i it!? nil50 p w d e r.=:.
ponder conactamente a las preguntas a las que con;c;:;r,
co.lunmen?e
quienes ticnen diez afios de edad; pero falla en la mayoria de las preguntas
de niveles de edades superiores, su cdificacibn d e edad sera d e die^.^
ObsCrvese que una de las prernisas fundamentales de las escalas d e
edad mental es la d e que 1as caracteristicas que se miden aumentan sistematicamente con la edad cronolbgica. Asi, 10s elementos esenciales en una
escala por edad mental son: (1) un conjunto de reactivos q u e discriminan
a las personas a diferentes edades; (2) un grupo normativo, compuesto de
una muestra representativa de personas de distintas edades, que proporciona la base para asignar un reactivo a un grupo particular de edad y (3) una
escala para reportar la ejecucion. En la fig. 10-4 se da un ejemplo hipotCtico d e como se asignaran 10s reactivos a 10s niveles d e edad.
6

En la practicu, lus cdificaciones por edad mtntal se dan en arfos y meses. Asi, una
u P~I hdividco o h v o Is misma calfficaci6n
que 10sniilos yia~ncdioC: 10 afios y 5 meses

cdi:?c~cid,idf edaC .jc 13 5 ~igaificaq

Caiijicaciones reiacionuuaias curt ius rrotttw

(Captrulo 10)

Reactivo I I

1 0 1 1

1 2 1 3

Edad cronolbgica

Reactivo

II

Ill

Nivel de edad mental

12

Fig. 10-4.

Desarrollo de una escala de edad mental.

Cuando las capacidades varian sistematicamente c o n la edad, las calificaciones de las edades son directas y ficiles d e interpretar. N o obstante,
cuando el indice de desarrollo varia d e allo en aiio, se dificulta s u interpretaci6n, debido a la cantidad d e lo adquirido en el crecimiento entre cada uno
d e 10s afios. ( 0 sea que el tamaiio de las unidades no e s igual). P o r ejemplo,
ia iirayur;o ;r ;ab ca+~;2;ic; i;,t!:~!:
2: " D E ~ T T ~ ~ r~c In! ; : - J c ~ P ~
:I
ur, incicc bastante constacre, durante toda la infancia; pero el' ia.?ic: .I:
crecimiento comienza a desacelerarse durante la adolescencia. Por consifuiente, el incremento, por ejemplo, en la comprensi6n d e lo leido, sera
menor entre 17 y 1 8 afios que entre 7 y 8. Por esto, u n a diferencia d e un
afio en las calificaciones por edad mental tendre diferentes aplicaciones a las
diversas edades. Ademis, puesto q u e la ejecucion se v e r i afectada por la
educacion o las experiencias de la vida en general. Lo q u e es "normal"
para una edad dada, en determinadas circunstancias, p u e d e no ser "normal"
en otras condiciones. Por todas estas razones, las escalas d e edad mental
se utilizan de mod0 mas adecuado con 10s nillos mas jovenes q u e crecen
en ambientes comunes y corrientes; para 10s niiios y 10s adulros d e ambientes
atipicos o restringidos, las calificaciones por edad mental seran menos significativas.

C;lIi/icaciones relacionadas con las normas

(Capftulo 10)

Calificaciones relacionadas con las n o r m u

clase. En esas situaciones, todos 10s grados incluirin a a l unos


~
alurnnos
que son rnayores y otros mas jbvenes que 10s niiios q u e han svanzado d s
grado en grado, seg6n, las normas comunes d e avance. Para controlar esa
diversidad, algunos editores de pruebas utilizan normas rnodales d e edadgrado. Esas nornias se basan en muestras que incluyen s o l o a alumnos q u e
estan en el grado especifico para su nivel de edad. Los estudiantes a w n l a jados o retrasados un ail0 o mas se elirninan d e 10s grupos normativos. para
proporcionar una lnejor estimacion de la ejecuci6n estsndar d c 10s nilios
en un grad0 particular. Por esto, a1 interpretar calificaciones q u i v a l s n t e s
a grados, es preciso tornar en consideracibn n o solo el material ensefiado,
sino tarnbiin las norrnas de prornocion. Hay o t r o problema en las calificaciones eqbivalentes a grados escolares. Se desarrollan calificaciones para
una muestra de grados y, por definicion, la mitad d e 10s estudiantes del
grado mas alto tendran calificaciones por encinia del p r o m r d i o para esr
grado. LA quk, grado equivalente se deben asignar? El proccdimiento
habitual es el de asignar calificaciones extrapolando a niveles de grados
rnis elevados; sin embargo, en este punto nos encontramos con el rnismo
problerna que con las calificaciones de edades -0 sea, indices rnis Isntos
de desarrollo a1 pasar 10s ailos. Por ello, las calificaciones extrapoladas son
con frecuencia bastante irnprecisas.

Escalas d e grados escolares


Otro tipo anilogo de calificacion es el d e la escala d e grados escolares.
En lugar de cornparar la ejecucion d e un individuo con el de personas d e
diferentes edades, las escalas d e grados escolares comparan su ejecucion con
la del prornedio de 10s estudiantes en varios grados. Asi, si el equivalente
d e grado de Jorge en una prue5a d e aritmktica es d e 3-5 su ejecucion es
comparable a1 d e un alumno prolnedio en el quinto nits del tercer g a d o
(puesto que el crecirniento continlia durante el aAo, las calificaciones de
grados se dan como meses dentro d e cada grado).' Los procedimientos
para elegir reactivos y asignar calificaciones son directamente anilogos a
10s utilizados en escalas por edad mental, con la exception d e que se utilizan
niveles dc grados escolares, en lugar d e edades.
Al igual que las calificaciones por edad mental, las calificaciones tquivalentes 3 grados escolares solo son apropiadas cuando la caracteristica
medida varia sistematicamente dentro de 10s niveles d e 10s grados de estudios. Adernas, se deben presuponer las experiencias educativas sirnilares.
Corno ilustracion, supongarnos que una prueba d e matemiticas d e nivel
de secundaria consiste en 75 preguntas -50 de aritmktica y 25 d e ilgebray se aplica en el sexto rnes del curso. Supongarnos tambikn que la calificacion promedio para 10s alumnos d e octavo grado es d e 4 0 y para 10s d e
noveno grado d e 5 0 y que el ilgebra se imparte so10 en el noveno grado.
Alberto, un alumno de octavo grado, pasa la prueba y obtiene un resultado
bruro d e 50-, o sea, la calificacion promedio para 10s alumnos d e noveno
grado. i Q u i quiere decir esta calificacion? Alberto obtuvo probablernente
esa calificaci6n a1 responder con una gran precision a las preguntas de aritrnktica, rnientras q u e 10s niiios prornedio de noveno grado obtuvieron la misma
calificacion, a1 responder correctamente a algunas d e !as preguntas de aritrnktica y a!:unas de las preguntas de algebra. En otras palabras, Alberto y
-' ;;;;iiantc
p:c;r,-di:,
de :I.>\'-::;:-<Q
nt,:;.m~r~n; Q C r n i s r n n s r.,~lificaciones; pero respuridiclvn correctamci;te b; difexnt:; Fxpun!:~. Por ende, e!
conocimiento de las matemiticas que tiene Alberto no es necssariarnente
equivalente a1 de 10s estudiantes prornedio de noveno grado, porque no
habia estudiado algebra.

Evaluaci6n
Las ventajas de las Escalas de Desarrollo s o n : (1) d a n las calificaciones
en unidades que se pueden leer con facilidad -en tkrrninos de equivalentss
de grados o edades; ( 2 ) proporcionan una cornparacion directa con la rjecuci6n de 10s coetaneos del estudiante y (3) brintlan una base para las cornparaciones entre individuos y para el estudio del crecirniento a ~ r a v k sdel
tiernpo. Sus principales desventajas son: ( I ) que solo son apropiadas cuando
i~ cara~rcristicanied~cia c i ? ~ ~ . t sistecnificr,me3!.
id
!r, i..:,G.
r - - - -I-ss lirnita prirnordialme~~te
a1 ~ r s crnr! !cr niiios pcq.~c.ilas;( 2 ) :,- :.;; ;f,-c:;da,
por la coniposicion -0 sea, las experiencias y la education a n ~ e r i o r - -d r l
grupo normativo; (3) las unidades de la escala a diversas edades o di>:irltos
<.ratloo ed:d
grados, no son igualcs y (3) las extrapolaciones d e un nivzl d c ,
a o t r o son arriesgadas. En resurnen, las escalas de edad mental 5. grados
cscolarrs no se puedcn interpretar en forma tan poco srnbipua corno pudicran sugerirlo las consideraciones superficiales.
t.,!!?

A..

Adernas d e depender d e 10s tenlas enseiiados en varios niveles de grados


de estudio, las calificaciones d e grados escolarzs reflejan tambikn la coniposicion del grupo normativo. Ya rnencionanios el hecho d e que las experiencias educativas d e 10s estudiantes tienen qus ser similares a las experiencias de 10s alumnos del grupo normativo. Adzmas, algunas escuelas lienen
progranias no graduados o exigen que 10s nifios repitan un grado si su rendimiento no satisface ciertas normas minimas y aceleran 10s cursos de 10s
alumnos cu}o rendimiento sobrepasa claramente a1 de sus compaiieros de
I

Se presupone por lo cornun un d o escolar de 10 nieses. Asi, por ejemplo, en rercer


2 1 : d o ,Inr. .,,\ificaciones equiv&nlec arados puedaq ir de 3-0 a 3-9.
:I

239

TIFTT
*,,1-

Debido a este problerna d e interpretation d c caljficaciones squivalerltcs


a grados, muchas personas prefieren utilizar 10s rangos percentilares entre
grados en lugar de calificaciones por grados. En este mCtodo. 13 c.alificscion
d e un individuo se expresa corno su clasificacion relativa ~ r m g op c r ~ ~ n t i l1.s r
dentro de un nivel particular de grado. Asi. en nuestro ejzrnplo. 13 calificaciOn d e Alberto puede caer en el percentil 95 para estudiantes d c 0ct3vo
grado.

240

Calificaciones relacionadas con las normas

calificaciones relacionadas con la normas

(Capitulo 10)

una medida de la capacidad intelectuai o la ubi.aci6n e n u n grado escolar.


La finalidad de esas razones es la de comparar las realizaciones verdaderas
de una persona con su ejecucion esperada (estimado a partir d e s u edad
cronologica, su grado escolar o su inteligencia). Esos cocientes tienen dos
desventajas principales. En primer lugar, la raz6n de d o s calificaciones
n o confiables sera menos contiable q u e cualquier otra medida individual.
En esa forma, el cociente seri normalmente u n a medida insegura desde
el punto de vista estadistico. En segundo lugar, comparar una medida de
rendimiento con otra de capacidad intelectual presupone q u e el rendimient o esta determinado exclusivamente por la capacidad intelectual.. Esta
suposicion constrictiva e inconsistente con 10s hechos empiricos. En opinion
del autor, lo mejor q u e se puede hacer es ignorar 10s cocientes d e rendimiento basados en la comparacion de las caliticaciones d e pruebas d e rendimiento para medir el destrrollo intelectual.

RAZONES Y COCIENTES
Se han hecho muchos intentos para desarrollar escalas que utilicen la
razdn entre d o s calificaciones. Quizi el m i s conocido de todos sea el cociente
~ntelectual(CI). En la prueba original d e inteligencia de Binet, las calificaciones se expresaban en una escala de edades. Al utilizar su prueba, algunos psicometras sefialaron q u e una edad mental de 1 0 podria tener significados e implicaciones diferentes si la obtenia un nilro d e 8, 1 0 6 15 allos
de edad. En consecuencia, recomendaron que se midiera el indice de desarrollo mental, a1 igual q u e el nivel de desarrollo (o sea, la edad mental). El
cociente intelectual, definido como la raz6n entre la edad mental del nillo
y su edad cronologica, se propuso como indice del ritmo del desarrollo
intelectual:
C1 =

Edad mental
Edad cronologica

24 i

X 100

METODOS
Como se puede ver en esta formula, un niiio cuyo desarrollo intelectual es promedio para su edad ( 0 sea, un niiio cuya edad mental es igual
a su edad cronologica) obtendra un CI de 100, mientras q u e 10s nifios cuyo
desarrollo mental es mas rapid0 que el promedio obtendran indices de m8s
de 100 y 10s q u e tengan u n desarrollo mas bajo q u e el promedio tendran
un CI menor d e 100. Cuanto mas se desvie del promedio el indice d e desarrollo, tanto m i s se alejari el C I d e 100.
Un CI calculado de este m o d 0 es una raz6n de CI. En la principal
revision norteamericana d e la prueba de Binet -]as formas L y M de la
prueba de Stanford-Binet-, la distribution de 10s CI mostro una desviariOn estandar de aproxim3jsmer?te 16 guntcc. No obstan!:,
esas desviaciones estandar variaban aproximadamente de 1 L a LU puntos o e Ci a distintos niveles d e edades (Terman y Merrill, 1937). Debldo a las desviaclones
estandar n o equivalentes y el hecho d e que el crecimiento intelectual n o
aumenta linealmente con 10s incrementos de la edad, las razones de CI n o
se utilizan ya e n las principales pruebas d e ~nteligencia. En lugar de ello,
se emplean en la actualidad calificaclones estandar normalizadas, basados
en una muestra representativa d e la poblacion a cada nivel. Estas calificaciones, denominadas CI d e desviacion (CIS) tienen una media d e 100 y una
desviacion estindar d e 15 (escalas de Wechsler) o 1 6 (Stanford-Binet) puntos
en cada nivel d e edad.
El CI mide el indice de desarrollo intelectual general. En las pruebas
apllcadas a la educacion, se encuentran con frecuencia medidas q u e se
supone q u e indican el indice de ejecucion y desarrollo educativo. Estos
tndlces reciben varios nombres, tales como cocientes educativos o cocientes
de rendimiento. Todos estos indices son razones que utilizan como numerador algund iiiedlda o r ejccuclbn y w i n o dznominador 12 edsd :rsnologic:,

PARA

PRESENTAR

DATOS

NORMATIVOS

Anteriormente, en este capitulo, analizamos la construccion d e las


normas d e grupo y el desarrollo d e diversos tipos d e calificaciones relacionadas con las normas. A continuation, pasamos a las t i c n i c a s para resumir
y presentar datos normativos.

CUADROS DE CONVERSION
La tecnica mas simple y bAsica para p r e s ~ n t a rdatos .n.nrm?!ivnc f s e!
cuadro de conversi6n o , como se denomina a veces, c u a d r o d e normas.
Un cuadro d e conversion muestra las calificaciones brutas o directas y las
derivadas equivalentes -ya Sean percentiles, calificaciones e s t i n d a r o cualquier otro tipo de calificaciones- para un g r u p o normativo especifico.
En esa forma, el cuadro de conversion permite a 10s usuarios d e las pru-bas
convertir una calificacion bruta en una derivada o encontrar la calificacion
bruta equivalente a una calificacion derivada particular. Los elementos
esenciales de un cuadro d e conversion son (1) u n a lista d e calificaciones
brutas o directas, (2) una lista correspondiente a las calificaciones deriradas
o tiansformadas y (3) una description del grupo normativo.
I

En el cuadro 10-4 se da un ejemplo de cuadro de conversion. E n este


cuadro (que se deriva de 10s cuadros 10- 1 y 10-2) se dan 10s rangos percentilares y las calificaciones estandar equivalentes d e la calificacion combinada
d e la prueba d e aptitudes universitarias ACT en vn g u p o d e a l u m ~ dc
~s

'

23.2

2alificaciones relucionadas i o n las normas

Calificacion~srelacionadas con las rrortms

(Capitulo 10)

243

Calificaciones
brutas o
directas

Rangos
percentilares

Calificaciones
estindar

grupo norrnativo; no dan evidencias directas d e las calificaciones q u e pudieran asociarse a la calificacion de una prueba dada. Si sabemos q u e las calificaciones de la prueba piedicen alguna consecuencia irnportante, podremos
sacar ciertas mferencias de las calificaciones. Por e j e ~ n p l o , si la prueba
predice las calificaciones universitarias, podremos inferir q u e c u a n t o m i s
aka sea su clasificacion (resultado de la prueba), tanto mayores s c r i n lab
calificaciones que o b t e n d r i probablemente.

32
31
30
29
28
77
26
25
24
23
22
21

9 9'
96
89
78
67
54
42
31
21
13
6
1

70
66
62
59
55
52
48
44
41
37
34
30

A la inversa, si n o hay evidencias d e validez, 10s d a t o s del cuadro d e


conversiones so10 indicarin la clasificaci6n relativa dc. cada estudiante
dentro del grupo -y nada rnis. Es precis0 insistir en este lilrinio p u n t o .
Con demasiada frecuencia, la disponibilidad de 10s d a t o s normntivos sc
torna corno licencia para interpretar la ejecucion en la prueba conlo indication de una ejecucion probablemente aha en alghn criterio. Sin d a t o s
d e validez, las tablas de conversion solo traducen las a l i f i c a c i o n e s brutas
e n algun otro tipo de calificacion. lncluso con datos de validez, el dessmpelio en un criterib s61o se puede inferir d e 10s datos normativos. 0 sea,
que 10s resultados brutos se convierten en medidas relativas del desenipelio, clue n o se expresan en tirminos de consecuencias. C o m o veremos
m-as adelante. n o hay razon por la que 10s datos normativos n o s t puedan
expresar en funcion de las consecuencias.

Cuadro 10-4.
-~-

Ejemplo d e cuadro d e normas (conversion)

Rangos
-percentilares y calificaciones estindar equivalentes en una prueba
de aptitudes universitarias

N = 177 alumnas de primer aiio de artes liberales, en una universidad del


oeste medio

Con frecuencia se presentan en el cuadro d e conversion datos d e varias


subpruebas ( 0 escalas) o de varias pruebas de una sola bateria. C u a n d o se
tienen que interpretar esos datos es irnportante esta prcciucion: a menos
que sz use el mismo grupo normativo, las calificaciones n o s s r i n comparai-], e~- ~-1: , ~ r e c ! m e ~ i pucsto
te.
que SP besar5n cn ~ilI1c::l.a~ dire:.rn~:,\ q: :.x
datos se basan en un grupo nomlativo c n v i ~ n ,rnmo r i - . h e ~ ~r!::r!!?. rz:?
tipo dc cuadro dc corwersion proporciona un mCtodo para comp;il.ar di~.c.~r;imcnte la ejecucio~idc un individuo en varias pruebas o subpruebas.

primer aAo para un programa de estudios en artes liberales (propedeutica).


Para leer el cuadro, solo tenernos que tomar en cocsideraci6n la5 calificaciofuel; de
n
,.n,m - ,hile:. dad-, !&i, ~1 r.:;j!'~~urihnh r r l t a de 111-1 r.q~lfii:~nte
2 7 , > \ I pericii;il seria f 4 ;: ~ L iI a l i f i x ~ i C : c:tlnd2r 52. !r.tt.r:?r?t?.r!?n?^s511
calificacion, diciendo que, e n comparacion con las alumnas de primer 3 A 0 de
artes liberales en esa universidad, tenia una posicion a 0.2 desviaciones
estindar por encirna d e la media (calificacion estindar = 57,) 0 que su calificacion superaba a la de 54% de 10s alurnnos de ese curso (rango percentilar
= 54).
Hay varios aspectos d e esta interpretacion que vale la pena recalcar. En
primer lugar, la calificaci6n se interpret6 en cornparaci6n con las calificaciones d e un grupo normativo especifico: en este caso, las alurnnas de primer
afio d e artes liberales de una universidad dada. Para comparar su ejecucion
con la de otros grupos se requeririan otros cuadros de normas. En segundo
lugar, las calificaciones se expresaron como percentiles y corno calificaciones
estindar. En otros casos, el cuadro de conversi6n podria incluir s610 un tip0
de calificaciones derivadas. En tercer lugar, las calificaciones derivadas del
<6]0!" :)+,-lh:i5n relativa del a!un?no dcntro del
.7;::dro de mnversi6r,
::rtn

CUADROS D E CONVERSIONES MULTIPLES

En el cuadro 10-5 se ilustra un cuadro d e conversibn q u e prcsenta


los datos normativos para las diversas subpruebas d e la ACT. I'uetle \.ersth
que la niisnia calificacion bruta (calificacion escalar) da c o m o r e s u l ~ a d o
rangos percentilares n ~ u ydiferentes en las varias subpruebas. A la inversa.
para obtener rangos percentilares equivalentes en las varirts subpruebas se
requieren calificaciones escalares totalnlente diferentes.

I
I

En otras ocasiones, podemos utilizar un cuadro d e conversion para


niosrrar la ejecuci6n de varios grupos distintos e n una sola prueba. En el
cuadro 10-6 se da un ejernplo de ese cuadro, q u e proporciona dos tipos
d e inl'or~nacion. En primer lugar, puesto que prcsenta c;llificacioncs dsrivadab ;#ara varios grupos, el usuario d r la prueba puede utilizar 1:1s califi-

244

Calificaciones relacionadas con las normas

Cuadro 10-5.

Ejemplo de cuadro de convesibn que muestra normas


para diferen tes subpruebas

Calificacione:
escalares

Matematicas

Estudios
sociales

Ciencias
naturales

(Capttulo 10)

Calificacibn
combinada

99
95
90
84
76
66
56
46
36
28
22
18
14
11
8
6
4

3
2
1

245

Calificaciones relacionadas con las normas

"mas sensible o vulnerable", puesto que 10s equivalentes en percentiles


son casi siempre mas altos. 0 bien, para ver 10s resultados de un mod0
diferente, una calificacion bruta de 2 8 sera equivalente a un rango percentilar de 82 en la universidad C, 65 en la E, 55 la A, 52 en la B y 35 en la D.
Por supuesto, esos descubrimientos reflejan diferencias en 10s antecedentes
en matematicas y en las capacidades de 10s estudiantes q u e eligen ingresar
a las diferentes universidades. Como tal, el cuadro de conversion no so10
proporciona datos normativos btiles, sino que, ademis, indica las caracteristicas (en este caso, las capacidades para las matematicas) de 10s alumnos
en 10s diversos grupos normativos.
Una advertencia. Si tuvitramos que comparar varios grupos directamente (como en el cuadro 10-6), las calificaciones se hubieran obtenido
en condiciones equivalentes. Por ejemplo, si la prueba se administrara como
examen de admismn en una universidad y como instrumento para asesoramiento en otra, la motivacibn de 10s dos grupos podria ser diferente. Por
supuesto, las diferencias de muestreo entre 10s diversos grupos liaria qus [as
comparaciones resultaran poco adecuadas.

PERFILES
Para algunas personas, las presentaciones visuales o g~aficasfacilitan la
comprension de grupos de calificaciones. El perfil de una prueba s i n e para
solucionar esta necesidad. Basicamente, un perfil no es masque una grafica
en la que se trazan una serie de calificaciones de una prueba. Todas las
calificaciones se trazan en la misma escala, utilizando normas derivadas de
rln grupo comun. El perfil muestra de una sola ojeada IT. confifuracion tlc
ids La;~fic,.ciu,,cs; ~ 1inii;ridii< r; ;;; ~ i \ : e r s zr.~--w~..--,u - h ;-..--.~" n
d i o o n < i t ! n nnct;.ih,:
relativa de sl;; diversas calificiicione;. EII la LA. :2-5 sc - - - - ' - " ^ I
"n'f;'
tipico de una prueba.
,,,"L_IL.'*

En el cuadro se muestran 10s equisalentes en percentiles en las cuatro pruebas (mas la calificacion combinada) del Programa Estadounidense de Pruebas
Universitarias (ACT). La muestra fue de 2,087 estudiantes de primer afio de
una universidad del oeste medio.

cdciones de un individuo para varios grupos normativos a1 mismo tiempo.


Y, en segundo lugar, el cuadro permite comparaciones entre las ejecuciones de varios grupos. Es decir, que a1 obsemar las calificaciones derivadas
equivalentes a varias calificaciones brutas podemos inferir quC grupo de
normas es m i s "consistente". Por ejemplo, en el cuadro 10-6, la universidad D rrpresenta el grupo normativo "mas consistente", porque una calificacihn brutn e:~rc..ifla'a kr.Cr9 ' ~ rcquival~nte
!
en percentiks mhs bajo que en
cuaiquier otro grupo. A ia inversa, la universidad C es el grupo normativo

-.

r.-I...

Se deben seguir varias reglas para que el perfil no presente un cuadro


engafioso. En primer lugar, se debe usar para cada prueba el mismo frupo
normativo. Si se utilizan diversos grupos normativos para las diversas pruebas, las calificaciones, que se basan en diferentes grupos no serin directamente comparables. En segundo lugar, todas las calificaciones se deben
trazar en la misma escala; o sea que todas ellas se tienen que expresar como
percentiles o como algun tip0 especifico de calificacion estindar. Como
corolario a este segundo punto se tiene la necesidad de utilizar dimensionrs
que no exageren las cliferencias pequefias o reduzcan las grandes. Este
ultimo problema se puede minimizar, si se sigue una tercera regla: o sea,
si se incluye en el perfil algun indice de error. Puesto que, todas las pruP
bas psicolbgicas tienen un grado de confiabilidad relativa y puesto que las
GiTtrcll&
zn!~e las cnlificacior.:. dc. la. pr::eh:r w n aun m i s rcl~:ivar"ci::e
confiablrs, las pequefias diierzncias entre las calificaciones titnilen a exagc-

246

Calificaciones relacionadas con las normas

(Capttulo 101

Calificaciones relacionadas con [as normas

Cuadro 10-6. Ejemplo de cuadro de conversidn o cuadros de norrnas que


muestra la ejecuci6n de varios grupos normativos en la misma prueba.
Calificacion

INVENTARIO DE ASESDRAMIENTO DE MINNESOTA


HOJA DEL PERFIL

Universidad

Calificscibn
estindar

FR

SR

ES

Calificacion
estandar

I .-

Calificacion
estandar

FR

SR ES

Calilicacion
estandar

En el cuadro se presentan equivalentes en percentiles de las calificaciones de


la prueba de matemiticas de la ACT, para cinco carreras, dentro de la misma
Universidad (E.U.A.). (Ver la explicaci6n en el texto).

rarse. Un intento interesante para rninimizar el peligro de la interpretacibn


exagerada (utilizado por la Psychological Corporation en sus Pruebss de
Aptitudes Diferenciales) es construir el perfil de tal mod0 que la diferencia
de cierta distancia mensurable en el perfil represente una diferencia significativa entre dos calificaciones; en esa forma, el usuario puede darse cuenta

I
I

Fig. 10-5. Ilustracih del perfil de una prueba. Reproducido con autorizacion. Copyright @ 1957 by the Psychological Corporation, Nueva York, N . Y . Derechos reservados.

con rapidez de qu& pares de calificaciones tienen diferencias significativas.


Otra altemativa es la de presentar las calificaciones como bandas, en lupar
de calificaciones exactas, de tal mod0 que las diferencias entrt. ellas solo
son significativas si las bandas no se superponen.

C i i ; k ~ c i u n r sreiacionauus con ius normus


Nombre
MURPHY JAMES L.

Razonamiento verbal

Cal!fi.
cacm
nes
bruta
I dire,
tag

Per.
cen.
tiles

21

70

Capacidad
numbrica

23

+ C.N.

50

R.V.

Razonamien.
to abstracto

40

Ortogrefla y
cdlculo para
oficinistas

29

Razonamien.
to mecanico

45

Relaciones
espaciales

30

0 nografla

62

Uso del
lenguaje

26

Escuela
CENTRAL

ID

Aio'
1972

(Capttulo i O j

Forma
dela
prueba
S

Grado
9

PERCENTILES
m m mnm

wnm a

Sexo
M

'-j

X ~ X & ~ ~ X X

OBSERVACION FINAL

decir que las distancias en el eje de calificaciones (vertical) son i p a l e s a


unidades de la escala z y 10s rangos percentilares correspondientes se colocan
a lo largo de esta escala. En otras palabras, 10s rangos percentilares se superponen en una escala de calificaciones estindar. La grifica d e norrnas percentilares proporciona las ventajas tanto de 10s percentiles como de las
calificaciones estindar, refleja con mayor precisibn la relaci6n de las calificaciones brutas con 10s percentiles y minirniza las probabilidades d e interpretar ma1 las diferencias entre percentiles. En la fig. 10-6 se ilustra un
ejernplo de grafica de normas percentilares. Obsirvese q u e en la grifica
las diferencias entre rangos percentilares son rnenores cerca drl centro d c
la distribucion y mayores en 10s extremes. Asi, la distribucion de-rangos
percentilares ofrece mas claramente un paralelo con la distribucion dt: las
calificaciones brutas. Por esta razon, quien interpreta la prueba n o tiene
tantas probabilidades de exagerar las diferencias pequefias cercanas a1 centrcr
de la distribucibn.

55
I

I XXX*XXX~/

10

mnm a s m m n o

PERCENTILES
*F-Percentiles y pruebas del primer semestre (otoRol;S-Percentiles y
pruebas del segundo semestre (primavera)
Fig. 10-6
Fj~mplnde u v a n r i f i c a de normas n~rcenrilares. La fnrma del ~ e r f i se
l
t o m 6 de las Pruebas d e aptitudes diferenciales (The Psychological Corporation).
Obsbrvese q u e el eje vertical tiene una escala d e unidades d e calificacaciones estindar, c o n l o r rangos percentilares superpuestos en esa escala. Reproducida c o n
autorizacl6n. Copyright O 1961. 1963 b y the Psychological Corporation, Nueva
York, N.Y. Derechos reservados.

GRAFICAS DE NORMAS PERCENTILARES


Uno de 10s rnejores modos de presentar perfiles de las pruebas -un
rnetodo que, a la vez, protege contra las exageraciones y facilita las interpretaciones- es el empleo de grlficas de normas percentilares. Una grifica
de normas percentilares es un perfil en el que las calificaciones se dan en
rangos percentilares; pero las dimensiones de la escala se trazan de mod0
clue corresponds a una ~ x a l ade c23'kaciones ~ s t a n d a r( z ) . Esto y i e r e

En todo este capitulo hemos hecho hincapii en q u e las calificaciones


relacionadas con normas solo indican la posicion relativa d e una persona
en cornparacion con algun grupo normativo pertinente. A menos q u c
haya ciertos datos de validez o alguna nornia absoluta d e ejecuciont nuestras interpretaciones se limitarin a afimaciones relacionadas solo con la
ejecucion en la prueba. No nos dan indicaciones sobre la ejecucion potencia1 en algunos criterios externos. En el capitulo que sigue nos ocuparemos
de las situaciones en que se interpreta la ejecucion de un individuo en la
prueba, comparandolo con algun estindar definido (calificaciones relacionadas con el contenido) o en funcion de la ejecucion en el critcrio (califiC:C~OIID~ ~ ~ ! ? r l c " ~ d
; ~a
v r ;l I a r cr,nser.c~,nciac
c zxdi~~;on~;).

Potrebbero piacerti anche