Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
elaborarnuestroscuestionarios.
EvaluacinmedianteHerramientasOnline:UnagestindeAudiencias
Accesibleparatodos.
FacultaddePsicologa
UniversidadAutnomadeMadrid
MikelAsensioBrouard
ElenaAsenjoHernanz
YoneCastroRos
Octubredel2012
Introduccin
En este pequeo texto vamos a procurar resumir algunas de las directrices bsicas
para la elaboracin de tems. Cuando decimos tem, nos referimos a las distintas
preguntascomponentesdeuncuestionariootestestandarizado.
Loprimeroquetenemosquehaceresseleccionarloscontenidosmsapropiadospara
nuestrocuestionarioyverquformadestosesmsapropiada.Unprimerpilotode
nuestro cuestionario puede ayudarnos a hacernos una idea de cmo va quedando y
nospermitirprobarloconunapequeamuestra(unreducidogrupodepersonasque
llevarnacabolaencuesta).Conlosdatosdeestepequeopilotopodemosrealizarun
anlisis breve de los tems para ver qu tal estn funcionando, y si nos valen, si hay
algn tem que no est funcionando correctamente, qu pregunta deberamos
cambiar, qu tendencias de respuesta existenetc. Con estos datos daremos cuenta
de la fiabilidad y la validez de nuestro cuestionario, que resultan ser dos dimensiones
muy importantes en esta rea para determinar si un test es vlido o no para cubrir
nuestrasnecesidades.Perovamosavercmofuncionaestadinmicapasoporpaso.
1. Ququeremosmedir;encontrandonuestroconstructo.
2. Tamaoyseleccinmuestral.
3. Construccinprovisionaldelcuestionario:Algunosformatosderespuesta.
4. Quhacerparanoelaborarmalostems?
5. Anlisisdelostems.
a. ndicedeDificultad
6. ndicedeValidez.
7. Fiabilidad.
1. Ququeremosmedir;encontrandonuestroconstructo.
Cuando intentamos definir operacionalmente un constructo o rasgo que queremos
medirloqueestamoshaciendoesestablecerlosobjetivosquepretendemosconseguir
con el cuestionario. Es decir, en psicologa nuestro objetivo puede ser, por ejemplo,
evaluar ansiedad rasgo o ansiedad estado, medir algn constructo en relacin a una
patologa o comprobar empricamente cmo ha funcionado un psicofrmaco
determinado en una muestra experimentalen comparacin con una muestra control.
Enotrasreasdeconocimiento,comoporejemploenlosestudiosdepblico,nuestro
objetivo puede ser ver qu tipo de pblico acude al museo, cmo cambia el perfil de
pblico si introducimos en el museo o cambiamos ciertas dinmicas, qu han
aprendidonuestrosvisitantesdespusdeunavisitaaunaexposicintemporal,cules
sonlosndicesdeimpactoysisehaproducidoconocimientoycmo,porejemplo.
Por lo tanto, lo primero de todo es saber qu queremos medir; definir sto
operacionalmenteyunaveztengamosclarosnuestrosobjetivos,ponernosmanosala
obra. Tambin es til saber a qu tipo de muestra va dirigido nuestro cuestionario
(escolares, poblacin normal, discapacitados, ancianos, visitantes de un museo,
poblaciones especficas) Porque no tendra sentido, por ejemplo, preguntar a una
persona de la calle por una exposicin que no ha visto, y no es lo mismo redactar un
testparapersonascondepresinqueparapersonascondiscapacidadintelectual.
2. Tamaoyseleccinmuestral
3. Construccinprovisionaldelcuestionario.
Tenemosquetenerencuentadoscosasmuyimportantesaesterespecto:
Por un lado el formato de respuesta y por otro, la redaccin de los tems. En este
apartado trataremos el formato de respuesta, y el apartado siguiente haremos
hincapienlaredaccindelostems.
Losformatosderespuestaseclasificanen:abiertosycerrados.
En las respuestas abiertas los sujetos pueden desarrollar su respuesta en lugar de
elegir dentro de opciones predeterminadas. Esto nos permite encontrar informacin
ms rica y elaborada que las opciones cerradas de respuesta, aunque puede
complicarnoselanlisisestadsticodelosdatos.
Ejemplos:
Lasrespuestascerradassuelenser:
deeleccinbinaria(sino,verdaderofalso)
Ejemplo:
deeleccinmltiple:deentredosomsalternativasseeligenuna(Excluyente)
ovariasrespuestas(Incluyente)
Ejemplo:
Excluyente
Incluyente
Excluyente
4. Quhacerparanoelaborarmalostems?
Enlostestderendimientoptimo:
La idea principal debe estar clara en el enunciado, que debe ser simple y
adecuado.
Hay que evitar los contenidos excesivamente triviales (o dar informacin
irrelevanteenelenunciado),yaquellosquesonexcesivamenterebuscados.
Hayquetenercuidadodenodarpistasdelasolucinenelenunciado.
Enlosderendimientoptimomejornopreguntarsobreopiniones.
Noesbuenoencadenarunostemsconotros(esdecir,relacionarlosentres).
La dificultad no debe estar en entender el enunciado, sino en saber cul es la
respuestacorrecta.
Cuantomscorto,precisoyeficazseaelenunciado,mejor.
Ojoalaortografa.
Siesunenunciadoconnegacin,hayquehacerlonotar.Porejemplo;Culde
estasopcionesNOeslacorrecta?
Ojoalasdoblesnegaciones.
Ojoconpoderdosrespuestascorrectas.
Evitamosopcionesderespuestastipo:lasdossoncorrectas,lasdossonfalsas,
no lo s, ninguna de las anteriores es correcta, todas las anteriores son
correctas.
RecordemoscambiarlaopcincorrectadelugarparaquenosiempresealaA,
laBolaC.(Aleatorizamoslarespuestacorrecta).
Paraevitarlosefectosdelosaciertosaleatoriosesmejorqueenpruebascortas
mantengamos ms de dos distractores (respuestas que NO son la correcta)
pero en pruebas ms o menos largas con dos distractores bastar (dos
opcionesincorrectas,ylacorrecta,entotaltresopcionesderespuesta).
Evitar el uso de las mismas respuestas, o la misma respuesta correcta en un
temparaotrotem.
Evitardistractoresdebroma.Usarunlenguajetcnicoycorrecto.
Hayquecorregirlosefectosdelaciertoporazar(restandoporejemplo,0,125a
lapuntuacinfinalporcadarespuestaincorrecta).
EnlostemsdeRendimientotpico:
Su contenido debe ser relevante y estar relacionando con lo que queremos
medir.
Hay que escribir los tems de forma que sean perfectamente comprensibles:
enunciadoscortos,simples
Redactar en el tiempo presente (evitando as, el pasado, el futuro, el
condicional)
Conviene redactar tems de modo directo e inverso para evitar el efecto de
aquiescencia (responder afirmativamente o negativamente de forma
independientealcontenido).
Evitar el uso de dobles negaciones (no, nunca, ninguno) o de afirmaciones
universales(todo,siempre,nada)
Evitar o corregir la deseabilidad social (la gente contesta lo que se espera de
ellos)
Controlar el uso de categoras centrales (dudo, no lo s, me da igual) ya que
puededarseunatendenciaacontestarsiempredeesamanera.
5. Anlisisdelostems.
a. ndicedeDificultad
Indica la proporcin de aciertos en la muestra que estamos utilizando. Nos indica el
gradodedificultad(mediamsalta,temmsfcil),dividiendoennmerodepersonas
quehanacertadoesetemporelnmerodepersonastotalquelohancontestado.Loa
valoressemuevenentre0y1.Cuantotendemosacerosignificaquenoshaquedado
un tem muy difcil y si tendemos a 1 ser que la mayor parte de los sujetos lo han
acertado,porloqueresultauntemfcil.Denadanossirveuntemconunndicede
Dificultadde0de1.Loquedeberamosconseguiresqueestendicetendieraa0,5,
paraqueseadiscriminativoentrelosdiferentessujetos.
*Ojo!Estendicesecalculaporcadatem,noporcadasujetoniesvlidoparatodoel
cuestionario.
6. Validez.
El concepto de validez se refiere principalmente a que nuestro cuestionario mida lo
que realmente se quiere evaluar. Por ejemplo y a grandes rasgos, un cuestionario
sobreconocimientosacercadeunaexposicintemporaldeunmuseo,deberaasignar
puntuaciones altas (en nmero de aciertos por ejemplo) a las personas que hayan
aprendidomucho,ypuntuacionesmuybajasapersonasqueporunmotivouotrono
hayanasumidolosconceptosqueelevaluadorhabaconsideradoenlaevaluacin.
Existenvariostiposdevalidez(decontenido,deconstructoyreferidaalcriterio)ypara
asegurarnos la validez de nuestro cuestionario en estas tres dimensiones, podemos
poner ms ahnco en la especificacin de nuestros objetivos o conseguir la
colaboracin de expertos en la construccin de nuestras herramientas de evaluacin.
Adems, debemos cuidar mucho el planteamiento de nuestras hiptesis de partida,
realizar mediciones continuas o realizar anlisis factoriales mediante un programa de
anlisisestadstico.
7. Fiabilidad.
El concepto de Fiabilidad puede entenderse de tres maneras diferentes: por un lado,
puedeentendersecomolaestabilidadtemporalquetienennuestrasmedidastomadas
atravsdeuncuestionario,porotrolado,comoelgradoenquelasdiferentespartes
deuncuestionariomidenunrasgooconstructodemaneraconsistente(estaacepcin
no nos sirve de mucho en este campo) y por ltimo, como el grado de equivalencia
entredosformasparalelasdeuncuestionario(dosformasoversionesdelmismotest
o cuestionario; de modo que nos permite subsanar el efecto del aprendizaje). El
clculo de la fiabilidad de un cuestionario igual que la validez, requiere de un
tratamiento estadstico, por lo que instamos a los interesados a revisar la bibliografa
propuesta para poder adentrarse un poco ms en este campo del tratamiento de los
datos.
BibliografaRecomendada:
Abad, J., Garca, C., Olea, J., Ponsoda, V., (2009) Introduccin a la Psicometra. Teora
Clsica de los Test y Teora de Respuesta al tem. Universidad Autnoma de
Madrid.
Botella,J(2003)AnlisisdedatosenPsicologaI:Teorayejercicios.Ed.Pirmide.
Garca,C.,etal.(2001).165ejerciciosresueltosdeTeoraClsicadelosTests.Madrid:
UniversidadPontificiadeComillas.
MartnezArias et al. (2006). Psicometra. Madrid: Alianza Editorial
MuizJ.(2002).Teoraclsicadelostests.Madrid.Pirmide.
Muiz,J(1997):Introduccinalateoraderespuestaalostems.Madrid.Pirmide.