Sei sulla pagina 1di 23

Seleccin o Construccin de un Instrumento de Medicin en Ciencias Sociales y Humanas Una perspectiva Psicomtrica: Validez y confiabilidad 1

Objetivo Asesorar en la seleccin / elaboracin y validacin de los instrumentos de recoleccin de datos que van a utilizar los tesistas en el desarrollo de sus investigaciones. Estas actividades, se refieren a lo siguiente: 1. La seleccin de un instrumento ya elaborado por estudios de investigacin antecedentes, en el caso de tesistas que tomaron este tipo de decisin. l o los instrumentos deben ser pertinentes con la naturaleza de la variable o variables a investigar, los propsitos de la investigacin y el tipo de datos que se requiere recoger. Y ello no exime de la subsiguiente validacin del instrumento, utilizando procedimientos para establecer sus niveles de confiabilidad. 2. La construccin de un instrumento, para el caso de tesistas que no optaron por un instrumento ya elaborado. Lo cual desde una perspectiva psicomtrica implica la subsiguiente validacin del instrumento, utilizando procedimientos para establecer sus niveles de confiabilidad y de validez.

Definiciones Bsicas
Es necesario que toda medicin o instrumento de recoleccin de datos rena dos requisitos esenciales: confiabilidad y validez. La confiabilidad o fiabilidad de un instrumento de medicin se refiere al grado de precisin o exactitud de la medida, en el sentido de que si se aplica repetidamente el instrumento al mismo sujeto objeto producir iguales resultados. Es el caso, por ejemplo, de un balanza o de un termmetro, los cuales sern confiables si al pesarse o medirse la temperatura en dos ocasiones seguidas, se obtienen los mismos datos. En cambio cuanto mayor es la diferencia entre medidas del mismo rasgo en repetidas ocasiones, se infiere que tanto menor es la confiabilidad del instrumento. Hay factores que determinan la falta de confiabilidad de un instrumento: la construccin, la administracin, la evaluacin. En la construccin del instrumento es necesario tener en cuenta prioritariamente la eleccin de los tems. En la administracin: es necesario considerar que se examine a todos los participantes de forma homognea, as como que las instrucciones sean estandarizadas. En la evaluacin: es necesario tener estrategias para detectar errores puramente mecnicos (ausencia de respuestas, respuestas indebidas, etc.). La validez se refiere al grado en que un instrumento mide la variable que pretende medir. Por ejemplo, un test de inteligencia no ser vlido, si lo que mide es realmente memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy fciles de observar o bien de preguntar y obtener una respuesta vlida. Pero cuando se trata de otras muchas variables que se trabajan en ciencias sociales y humanas como las motivaciones, actitudes, sentimientos, emociones, etc., la validez de un instrumento que pretenda medirlas se torna ms compleja, y por lo tanto, cabe preguntarse si realmente el instrumento estar midiendo lo que pretende medir? La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia. Hay tres tipos de evidencia establecidos por la APA: validez de contenido, de criterio y de constructo (o construccin). La validez de contenido se refiere al grado en que un instrumento refleja un dominio especfico del contenido de lo que se mide, es decir, establece la relacin del instrumento con las variables que pretende medir. Da garantas de que se han definido claramente los diversos aspectos del rea que se quiere medir y que cada uno de estos aspectos se encuentra convenientemente representado
1

Estos materiales estn constituidos nayoritariamente por extractos de las fuentes bibliogrficas sealadas

en un nmero adecuado de tems. Entonces, es necesario que un instrumento de medicin contenga representados a todos los tems del dominio de contenido de las variables a medir. Por ejemplo, una prueba de operaciones aritmticas no tendr validez de contenido si explora resta y multiplicacin y excluye problemas de suma y divisin. Si se pudiera contar con el universo de tems que permita medir el universo del contenido (y asumiendo que el contenido est claramente definido), sera fcil seleccionar aleatoriamente a un conjunto de tems que represente a ese universo y que permitira hacer la medicin. Sin embargo, usualmente no se cuenta con la seguridad de tal representacin o no se dispone explcitamente de los contenidos, por ello es necesario proceder por caminos ms indirectos y falibles que pasan por anlisis racionales parciales de contenidos (consulta a expertos). La validez de criterio implica que la medicin del instrumento se ajusta o sirve a un criterio externo. Es el grado de eficacia con el que se puede predecir o pronosticar una variable de inters (criterio) a partir de las puntuaciones de un instrumento. Si el criterio se ajusta al futuro se habla de validez predictiva, Por ejemplo, una prueba de inteligencia puede comparar sus resultados con el rendimiento futuro (criterio: promedios finales) de los estudiantes. Si el criterio se fija en el presente se habla de validez concurrente (en el sentido que los resultados del instrumento correlacionan con el criterio en el mismo momento o intervalo de tiempo). Por ejemplo, una encuesta administrada a boca de urna para detectar las preferencias del electorado, se compara con los resultados finales de la votacin conocidos a las pocas horas. La validez de constructo se refiere al grado en que una medicin aportada por un instrumento relaciona consistentemente con otras mediciones que han surgido de hiptesis de teoras antecedentes. Se refiere a qu tan exitosamente un instrumento construido a partir de una teora representa y mide el concepto terico en referencia. Se tendr mayor confianza en la validez de constructo de una medicin cuando sus resultados se correlacionan significativamente con un mayor nmero de mediciones de variables que, en esa teora, de acuerdo con estudios antecedentes, est relacionada. Por ejemplo, s, teoras antecedentes e investigaciones hechas muestran que el constructo "X" se relaciona positivamente con el "Y", "Z" y "R", Y negativamente con "W". Entonces, s el instrumento mide realmente "X", se deber comprobar que sus resultados se correlacionan positivamente con los obtenidos en las mediciones de "Y", "Z" y "R", y a la vez se correlacionan negativamente con los resultados de W. En consecuencia, es pertinente decir que: Validez total = validez de contenido + validez de criterio + validez de constructo. Cabe agregar que un instrumento de medicin puede ser confiable pero no vlido, puede medir consistentemente un aspecto ms no referirse (medir) con precisin lo que pretende medir el investigador. Por ello es requisito que un instrumento de medicin demuestre ser tanto confiable como vlido. Existen algunos factores que pueden afectar la confiabilidad y la validez: La improvisacin. Algunas personas creen que elegir un instrumento de medicin (o desarrollar uno) es algo fcil y que no requiere de supervisin alguna. Para poder construir un instrumento se requiere conocer muy bien la variable que se pretende medir y la teora que la sustenta. El no estar validados en el contexto donde se aplican. Traducir un instrumento, an cuando se adapten los trminos al lenguaje de la poblacin que se estudiar no es ni remotamente validarlo. Es simplemente un primer paso ya que validar un instrumento implica realizar una investigacin extensa y compleja. Los grupos, las personas cambian y tienen valores diferentes de acuerdo a la cultura. Razn por la cual es necesario aplicar instrumentos ya validados en cada contexto sociocultural. El instrumento es inadecuado o no es emptico. Hay instrumentos que tienen un lenguaje muy elevado para los sujetos estudiados o no toman en cuenta diferencias de sexo, edad nivel ocupacional y educativo; todo esto puede resultar en errores de validez y confiabilidad del instrumento de medicin. Las condiciones en que se aplica el instrumento. El ruido, presionar para que una persona conteste un instrumento largo en un perodo de tiempo corto, el hambre o falta de motivacin para responder influir negativamente en la validez y confiabilidad de la medida.

Los aspectos logsticos. Que el instrumento tenga instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que no le falten pginas, que haya un espacio adecuado para contestar.

Procedimientos generales para saber que un instrumento es Confiable y Vlido


En la prctica es casi imposible que una medicin sea perfecta, generalmente se tiene un grado de error. Desde luego, se trata que este error sea el mnimo posible y para ello hay formas de estimar la confiabilidad y la validez. Para evaluar la confiabilidad los procedimientos utilizan frmulas que producen "coeficientes", los cuales pueden oscilar entre 0 y 1, donde 0 significa confiabilidad nula y 1 representa el mximo de confiabilidad. Entre ms se acerque el coeficiente a 0 habr mayor error en la medicin. La confiabilidad puede ser examinada desde tres dimensiones: estabilidad, consistencia interna, fiabilidad nter-examinadores. La estabilidad indica el grado en que el puntaje de un sujeto en un instrumento de medicin (prueba, test, etc.) est libre de errores. La consistencia interna da a conocer en qu medida la eleccin de la muestra de tems que compone el instrumento (es decir, de los tems respecto al universo de contenidos) est libre de errores (o ms bien resulta una fuente de error en la medicin). La fiabilidad inter-examinadores verifica el grado en que la medicin de un rasgo (a travs de un instrumento) es independiente de la subjetividad del evaluador. Tambin se denomina: cotejo entre observadores. La estabilidad es examinada mediante los procedimientos de "test-retest" y "formas equivalentes". La consistencia interna por los mtodos de "particin en mitades" y "anlisis de varianza de tems" (contraste de grupos extremos y correlacin tem-total). La fiabilidad inter-examinadores por el mtodo de "cotejo entre observadores". Los seis procedimientos ms utilizados son: Medida de estabilidad o confabilidad por test-retest. Un mismo instrumento es aplicado dos o ms veces a un mismo grupo de personas. Si la correlacin entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. Desde luego, el perodo de tiempo entre las mediciones es un factor a considerar. Si es muy largo, otros factores como maduracin o cambio de condiciones pueden afectar la segunda medida. Si es muy corto, las personas pueden recordar cmo contestaron la primera vez y aparecer como ms consistentes la segunda vez. Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el mismo instrumento de medicin sino dos o ms versiones equivalentes de ste. Las versiones deben ser similares en contenido, instrucciones, duracin, etc. Por ejemplo cuando un profesor administra 2 o ms modalidades de examen en su grupo de alumnos. El instrumento es confiable si la correlacin entre los resultados de las dos o ms pruebas administradas es significativamente positiva y fuerte. Mtodo de mitades divididas (o particin en mitades). Aqu se administra un solo instrumento, una sola vez, pero se dividen las preguntas o los tems (por ejemplo los tems pares con respecto a los impares, o la primera mitad con respecto a la segunda mitad), Si correlacionan los resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la confiabilidad vara de acuerdo al nmero de tems de la prueba. Cuantos ms tems, mayor es la confiabilidad. Contraste de grupos extremos. Se realiza el contraste de medias en cada tem de los dos grupos con puntuaciones mayores y menores en el total del instrumento. Es el procedimiento ms usado por Likert para examinar la fiabilidad de las escalas ele actitudes el cual se basa en comparar en cada tem el 25% con puntuacin total ms alta con el 25% de puntuacin total ms baja. Lo que se espera es que el 25% superior tenga una media significativamente ms alta en cada tem que el 25% inferior. Se concluye que los tems que simultneamente diferencian a los mismos sujetos estn "midiendo lo mismo". Correlacin tem-total. Propiamente no se trata de la correlacin de cada tem con el total (o suma de todos los tems), sino de la correlacin de cada tem con la suma de todos los dems (o correlacin de cada tem con el total menos el tem; por lo cual suele denominarse "correlacin tem-

total corregida"). Con este procedimiento se espera comprobar en qu medida el puntuar alto en un tem supone de hecho obtener un total alto en el resto del instrumento (es decir, todos los dems tems). Actualmente este procedimiento esta tan automatizado que en el software paquete estadstico para las ciencias sociales, ms conocido como el SPSS, ya se ha predeterminado la correlacin temtotal menos el tem y simultneamente la fiabilidad de todo el instrumento si se suprime ese tem. Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos de observacin y registro. Dos o ms observadores aplican el mismo instrumento al mismo tiempo. Luego se calcula la correlacin de aspectos Coincidentes observados. Se considera confiable el instrumento si hay un porcentaje de coincidencias superior al 80%. Por supuesto que este mtodo implica que los observadores tengan el mismo nivel de preparacin o de entrenamiento para observar. El ndice Kappa es aplicado para valorar la fuerza del acuerdo o concordancia entre observadores. Adicionalmente a la aplicacin de uno o dos de los procedimientos indicados es necesario calcular la fiabilidad de todo el instrumento de medicin (test, escala, etc.). La forma ms utilizada para determinar la confiabilidad (consistencia interna) del instrumento es el coeficiente "alfa" de Cronbach. Este coeficiente determina el grado de consistencia y precisin del instrumento, para interpretar sus resultados los expertos consideran necesario usar la siguiente interpretacin de los valores:
Criterio de confiabilidad No es confiable Baja confiabilidad Moderada confiabilidad Fuerte confiabilidad Alta confiabilidad Valores -1 a 0 0.01 a 0. 49 0.5 a 0.75 0.76 a 0.89 0.9 a_1_

La comprobacin de la fiabilidad busca llegar a la seleccin de tems definitivos. Esta bsqueda se hace calculando la fiabilidad inicial, eliminando luego los peores tems y estimando sucesivamente la fiabilidad luego de modificar la cantidad de tems del instrumento. Lo que se busca entonces es calcular la fiabilidad con distintos subconjuntos de tems para poder elegir finalmente la seleccin de tems que ms convenza (fiabilidad ptima) para la versin definitiva del instrumento. En lo referente a la comprobacin de la validez del instrumento, la validez que ms interesa obtener en una investigacin es la validez: de contenido, seguida de la validez de constructo (o de construccin). Para comprobar la validez de contenido es necesario estudiar, en primer lugar, cmo ha sido tratada esta variable por otros investigadores anteriormente. En segundo lugar, es necesario elaborar un universo de tems tan amplio como sea posible, a fin de medir la variable en todas sus dimensiones. Posteriormente, consultar con investigadores familiarizados con el tema y la variable a medir para comprobar si el contenido es exhaustivo y si los tems cubren efectivamente tal contenido. Este procedimiento se conoce con el nombre de validacin por expertos. Es decir, determinar la validez de contenido del instrumento implica someterlo a la evaluacin de un panel de expertos antes de la aplicacin para que hagan los aportes necesarios a la construccin del mismo y confirmen si la construccin actual y el contenido del instrumento se ajustan al estudio planteado. Posteriormente, en un estudio piloto, es deseable emplear el "anlisis factorial", para determinar la validez de constructo del instrumento,

Procedimientos iniciales para construir o seleccionar los instrumentos de medicin pertinentes.


A continuacin las acciones mnimas necesarias para la construccin de un instrumento. Identificar la variable que se pretende medir observar. Las variables son caractersticas de los objetos o de los sujetos que adquieren distintos valores y son aquello que el instrumento medir. Revisar la definicin conceptual (de la variable) y comprender los alcances de su significado. Por ejemplo, comprender a quines se denomina "Espectador de bullying" y qu dimensiones o grandes aspectos envuelve. La definicin conceptual se refiere a la descripcin de las caractersticas o atributos relevantes de los fenmenos, objetos o sujetos para reconocerlos como ejemplares de la clase de fenmenos, objetos o sujetos a que se refiere el concepto. Para ello, es importante conocer las conceptualizaciones tericas brindadas por autores reconocidos como expertos en la comunidad cientfica que estudia el tema en referencia. Revisar cmo han sido definidas operacionalmente las variables. La operacionalizacin de las variables se refiere a un conjunto de procedimientos que narran o describen las actividades que el investigador realiza para medir las variables en estudio. Cuando el investigador dispone de varias opciones es conveniente que utilice el procedimiento que le reporte mayor informacin sobre las caractersticas o atributos relevantes de los fenmenos, objetos o sujetos en estudio. Elegir el instrumento o los instrumentos (ya existentes) que han sido favorecidos por la comparacin y adaptacin al contexto de la investigacin. Es necesario seleccionar los instrumentos de medicin que reporten mayor validez y confiabilidad. Si se selecciona un instrumento desarrollado en otro pas es necesario hacer al menos una prueba piloto. Aqu es conveniente recordar que traducir no es validar un instrumento, por muy buena que sea la traduccin. En caso de no encontrar un instrumento desarrollado adecuado, vlido y confiable y se quiera construir un instrumento propio, debe explicitarse la variable, sus dimensiones, los indicadores ms precisos y los tems para cada uno de ellos. Por ejemplo:
Variable Definicin Conceptual Operacionalizacin de la Variable Dimensiones Rol Ejecutivo Indicadores Toma de decisiones respecto al hijo Normas con respecto al hijo Sanciones con respecto al hijo Alimentacin Vestimenta Educacin Gastos Mdicos Expresin de cario Recreacin Celebracin de cumpleaos Crtica de conducta Elogio al hijo Coordina la recreacin de su hijo Planifica actividades Coordina actividades deportivas Items 1, 6, 11, 16, 2, 7, 12, 17, 19, 3, 8, 13, 18, 4, 9, 14, 5, 10, 15, 20.

Rol Paterno

Es el conjunto de funciones desempeadas por lo padres en la crianza del hijo

Rol Proveedor

Rol protector Rol Crtico Rol coordinador

En este caso, es necesario asegurarse de tener un nmero suficiente de tems para medir todas las dimensiones en todos sus indicadores.

Otro ejemplo:
Operacionalizacin de la Variable Variable Definicin Conceptual Items Dimensiones Indicadores Contestar preguntas Dar ejemplos apropiados Seguir instrucciones Recordar hechos especficos Recordar abstracciones Recordar procedimientos Aplicar conceptos Resuelve problemas Presenta pensamiento divergente

Es un proceso cognitivo de Comprender asimilacin, acomodacin que comprende ingreso de la informacin, comprensin , retencin y Retener Aprendizaje aplicacin de la respuesta a travs de los procesos de atencin, percepcin, Aplicar memoria, lenguaje, pensamiento e imaginacin

1, 4, 6, 9 11, 16, 2, 7, 12, 17, 19, 14, 3, 5, 8, 10, 13, 18.

En otros casos la operacionalizacin de la variable no requiere de variables intermedias o dimensiones; Por ejemplo:
Variable Definicin Conceptual Operacionalizacin de la Variable Indicadores Asistencia a clase Puntualidad Participacin en clase Realizacin oportuna de lecturas Participacin en grupos de discusin Elaboracin de trabajos Items 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 , 13 ,14.

Inters por la Asignatura

Actitud de acercamiento preferencial del estudiante a determinada asignatura

Precisar la escala de medida de cada tem y por ende, el de la variable. Recordemos que existen cuatro escalas de medida: La escala de medicin nominal. Indica que hay dos o ms categoras de respuesta las cuales no tienen orden o jerarqua. Por ejemplo, cuando preguntamos el estado civil, la religin, etc. Las variables nominales pueden ser dicotmicas (admiten slo dos valores, como el sexo, tipo de gestin escolar: privada o estatal, etc.) y politmicas (cuando admiten tres o ms valores: estado civil, religin profesada, etc). La escala de medicin ordinal. Indica que hay varias categoras, pero adems que estas mantienen un orden jerrquico, de mayor a menor. Por ejemplo el Grado o Nivel de Instruccin de las personas, el cargo que una persona ocupa dentro de una empresa o Institucin, etc. En los dos niveles mencionados no se pueden utilizar las operaciones matemticas bsicas, porque sus resultados no tendran sentido. Por ejemplo, si se precisara que para la variable Estado Civil la codificacin en numerales de sus valores fuera 1 = soltero, 2 = casado y 3 = viudo, en este caso no tendra sentido afirmar que 1 + 2 = 3 que seria lo mismo que decir que un sujeto soltero reunido con uno casado seria lo mismo que un sujeto viudo. La escala de medicin por intervalo, implica crear escalas de medicin donde las distancias entre las diferentes categoras de respuestas son iguales. El cero o punto de partida, es arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa que no haya temperatura. Algunas escalas de observacin y de medicin de opinin, o de actitudes, suelen tratarse como si fueran mediciones de intervalo. Aqu se permite utilizar las operaciones matemticas bsicas y algunas estadsticas. Por ejemplo, en este item de una escala de evaluacin del desempeo docente por los alumnos. Cmo considera el sistema de evaluacin de la asignatura? 1 --- 2 --- 3 --- 4 --- 5 (donde: 1 = deficiente, 5 = excelente)

La escala de medicin de razn, adems de tener todas las caractersticas del nivel de intervalo (distancias iguales entre las categoras de respuesta y aplicacin de operaciones matemticas bsicas), implica que es posible asignar un cero real y absoluto cuando no exista la caracterstica o propiedad a medir. Por ejemplo, este item de una ficha sociodemogrfica: Cuantos hijos tiene usted? 0 -- 1 -- 2 -- 3 -- 4 -- 5 -- 6 -- 7 -- 8 - 9 -- 10 ms En el aplicacin estadstica SPSS se emplean slo tres escalas: nominal, ordinal y escalar (en esta ultima se incluye a las escalas de intervalo y de razn). Elegir cmo se han de codificar los datos. La codificacin es necesaria para analizar los datos cuantitativamente en las Hojas de calculo (aplicar anlisis estadsticos). La mayora de las veces se usan numerales, aunque tambin se podran utilizar letras o smbolos, si la medicin de la variable es slo nominal u ordinal. Aplicar una Prueba Piloto del instrumento de medicin. Es decir, aplicar el instrumento a personas con caractersticas semejantes a las de la muestra o poblacin objetivo de nuestra investigacin. Ojo no tiene sentido proceder como hacen ciertos novatos en estos menesteres que utilizan los resultados de los sujetos de su investigacin para estimar la validez y confiabilidad de sus instrumentos, pues caen en el absurdo de pretender confiar en las medidas de las caractersticas de los sujetos investigados debido a las cualidades de su instrumento y a la vez pretender fundar su confianza en las cualidades de validez y confiabilidad de su instrumento respaldndose en que son aceptables como referentes las medidas de las caractersticas de los sujetos investigados. En esta Prueba Piloto se analiza si las instrucciones se comprenden y si los tems funcionan adecuadamente. Los resultados se utilizan para calcular la confiabilidad y de ser posible, la validez del instrumento de medicin. La prueba piloto se realiza con una pequea muestra; los estudiosos en estos temas aconsejan un 10% de personas semejantes a las que integrarn la muestra de la investigacin principal. Ajustar, modificar y mejorar el instrumento de medicin preliminar para lograr mayor nivel de confiabilidad y validez, en funcin al anlisis de los resultados de la prueba piloto. En los anexos de la tesis de investigacin es conveniente informar el procedimiento seguido para la aplicacin de la Prueba Piloto y la reestructuracin del instrumento posterior a la Prueba Piloto. Referencias bibliogrficas Morales Vallejo, P. (2006). Medicin de actitudes en psicologa y educacin: construccin de escalas y problemas metodolgicos. Madrid: Universitas. Fidalgo, A.M. (1996). Funcionamiento diferencial de los tems. En J. Muiz (Coord.), Psicometra. Madrid: Universitas. Prieto, G. y Delgado, A. R. (1996). Construccin de los tems. En J. Muiz (Coord.), Psicometra. Madrid: Universitas. Hernndez Sampieri, R., Fernndez Collado, C. y Baptista Lucio, P. (2003). Metodologa de la investigacin. Mxico: Mc Graw Hill.

Procedimiento para obtener el coeficiente "V" de Aiken para evaluar la validez de contenido por juicio de expertos
Para estimar la validez del instrumento se comprueba la validez de contenido a travs del juicio de expertos. A las respuestas proporcionadas por los expertos se aplica el coeficiente "V" de Aiken. Para obtener la validez de contenido de cada tem a travs del coeficiente "V" de Aiken se utiliza la siguiente frmula: V = -----------------n

* (c-l)

Donde:
S = la sumatoria de los acuerdos de las respuestas de los jueces por cada tem (donde valor: 1 = "acuerdo", 0 = "desacuerdo") n = nmero de jueces c = nmero de valores en la escala de valoracin (2, en el caso que se trate de acuerdo y desacuerdo, Verdadero y Falso, Si y No)

Por ejemplo, si se recurriera al criterio de cinco jueces, se tendran que promediar las V especficas obtenidas para los tems y finalmente sera necesario obtener el coeficiente V total. Para ello, se preguntara a los jueces sobre cada uno de los tems, por ejemplo: con dos preguntas generales, "el tem sirve para medir un tipo de espectador de bullying en particular?, Seale que tipo de espectador de bullying estara indicando". Asimismo es recomendable que se incorporen las sugerencias de los jueces acerca del modo de redaccin de los tems para la poblacin de sujetos estudiada. Las siguientes tablas muestran posibles resultados obtenidos en el ejemplo mencionado para cada una de las dimensiones y a nivel general. Para este efecto el numeral "1" representa el acuerdo del juez respecto a si el tem mide lo que pretende medir, mientras el numeral "0" expresa el desacuerdo. Dimensin Espectador indiferente-culpabilizado V de Aiken Jueces Acuerdos s tems s 1 2 3 4 5 -----------------5 * (2-l)

1 4 8 9 15 17 19 22 26 28 N=10

0 1 1 1 1 1 1 1 1 1

1 1 0 1 1 1 1 1 1 1

1 1 1 1 1 1 1 0 1 1

0 1 1 0 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

3 5 4 4 5 5 5 4 5 5 Total V

0.6 1 0.8 0.8 1 1 1 0.8 1 1 0.90

Se Observa que, de los diez tems que conforman la dimensin "indiferente-culpabilizado" seis alcanz una V de 1.00, mientras que tres una V de 0.80, y uno una V de 0.60, resultando un coeficiente V total de 0.90. A continuacin se presentan los resultados para la dimensin "Espectador pro-social".

Dimensin Espectador pro-social Jueces V de Aiken Acuerdos s tems s 1 2 3 4 5 -----------------5 * (2-l)

2 5 7 10 14 16 21 24 27 29 N=10

1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1

5 5 5 5 5 5 5 5 4 5 Total V

1 1 1 1 1 1 1 1 0.8 1 0.98

En el ejemplo se observa que, de los diez tems que conforman el factor "Espectador prosocial" nueve alcanzaron una V de 1.00 y uno obtuvo una V de 0.80, para una V total de 0.98. Dimensin Espectador antisocial Jueces V de Aiken Acuerdos s tems s 1 2 3 4 5 -----------------5 * (2-l)

3 6 11 12 13 18 20 23 25 30 N=10

0 1 1 1 1 1 1 1 0 1

1 1 1 1 1 1 0 1 1 1

1 1 1 1 1 1 1 0 1 1

1 1 1 1 1 1 0 1 1 0

1 1 1 1 1 1 1 1 1 1

4 5 5 5 5 5 3 4 4 4 Total V

0.80 1 1 1 1 1 0.60 0.80 0.80 0.80 0.88

En esta ltima tabla se observa que de los diez tems que conforman la dimensin "Espectador antisocial" cinco alcanzaron una V de 1.00, cuatro obtuvieron una V de 0.80 y uno obtuvo una V de 0.60, resultando un coeficiente V total de 0.88. Estos resultados permitiran concluir que segn la opinin de los jueces consultados los tems propuestos s corresponden (o son consistentes) con la variable que se pretende medir. Referencias bibliogrficas Morales Vallejo, P. (2006). Medicin de actitudes en psicologa y educacin: construccin de escalas y problemas metodolgicos. Madrid: Universitas. Exteberra, J., Tejedor, F. (2005). Anlisis descriptivo de datos en Educacin. Madrid: La Muralla. Ary D., Jacobs, L.Ch., Razavieh, A. (1987). Introduccin a la investigacin pedaggica. Mxico: Interamericana.

Uso del SPSS para el "Contraste de medias de cada tem de dos grupos extremos".
Paso 1: Recodificacin de los tems negativos En algunos instrumentos de medicin, escalas o tests, algunos tems aparecen en sentido negativo. En esos casos en la base de datos SPSS de las respuestas es necesario hacer previamente una recodificacin a fin de conseguir que todos los tems estn en el mismo sentido. Si por ejemplo de los tems de determinada escala hay cinco (el 7, 13, 19, 22, 25) de ellos que estn escritos de forma contraria a lo que mide la variable y en consecuencia tendran una valoracin negativa. En ese caso sera necesario hacer una recodificacin de sus valores. Esto se hace en el SPSS versin 15.0 en espaol con los mandos "Transformar", "Recodificar en las mismas variables",

Para lo cual seria necesario escoger las cinco preguntas indicadas, y luego hacer c1ick en "valores antiguos y nuevos": ingresar valor por valor (antiguo y nuevo) y dar c1ick en "Aadir". Luego en "Continuar" y luego en "Aceptar ", con lo cual se realizara la recodificacin.

Paso 2: "Contraste de medias de cada tem de los dos grupos extremos En esta parte lo que se busca comprobar es si las respuestas tienden a "covariar", es decir, si los sujetos tienden a responder de "manera consistente", en otras palabras se comprueba si los tems tienden a "diferenciar" a los sujetos, si los "discriminan" adecuadamente. En este procedimiento del "Contraste de medias de cada tem de los dos grupos extremos" se compara en cada tem los resultados del 25% de sujetos con puntuacin total "ms alta" con los resultados del 25% de sujetos con puntuacin total "ms baja". Lo que se espera es que los sujetos del 25% superior tengan una media significativamente ms alta en cada tem que los sujetos del 25% inferior. a) Obtener el valor total del instrumento de medicin sumando todos los tems del instrumento (Por ejemplo: TipoEsp1+ TipoEsp2 + TipoEsp3 + . + TipoEsp28 + TipoEsp29 + TipoEsp30). Esto lo se hace en el SPSS versin 15.0 en espaol con "Transformar", "Calcular variable

Escoger cada una de las preguntas correspondientes e irlas pasando con seguidas por el operador + hasta completar todas. Luego, obtener la nueva variable, el total, haciendo click en "Aceptar".

b) Calcular el valor de los percentiles 25 y 75 de la variable "Total". Seleccionar: "Analizar" luego "Estadsticos descriptivos" luego "Frecuencias...(Analizar / Estadsticos descriptivos / Frecuencias).

Seleccionar la variable "Total". Hacer click en botn "Estadsticos". En el cuadro de dilogo que aparece marcar la opcin "Percentiles" y escribir 25, seleccionar la opcin Aadir, y luego hacer lo mismo para 75. Dar c1ick en "Continuar" y luego en "Aceptar".

En el visor (Resultados) aparecern los valores de ambos percentiles: en el ejemplo, al percentil 25 le corresponde el valor 50,00 mientras al percentil 75 le corresponde 62,00.

c) Identificar a los sujetos que poseen una puntuacin igual o inferior al percentil 25 (25% inferior) y aquellos con puntuacin igual o superior al percentil 75 (25% superior). Para ello es necesario crear una nueva variable donde se codificara con un numeral determinado estos dos subgrupos (para diferenciarlos). Esto se puede hacer con una "recodificacin", en la siguiente secuencia: Seleccionar "Transformar" luego "Recodificar en distintas variables" (Transformar/ Recodificar en distintas variables).

Continuando con los datos del ejemplo: Pasar la variable "Total" a la ventana "Var. numrica Var. de Resultado" (ocupar el lugar del valor numrico), y escribir en la casilla "Var. de Resultado" el nombre "Subgrupos" (que ser el nombre de la nueva variable que identificar a los dos subgrupos). Seleccionar la opcin "Cambiar". Luego, seleccionar la opcin "Valores antiguos y nuevos" del cuadro de dilogo. Aparecer una nueva ventana. Escribir en la parte de la izquierda de sta, debajo de "valor antiguo", en el casillero "Rango, MENOR hasta valor", el valor del percentil 25 que hemos calculado previamente: 50 y en "valor nuevo el nmero 1. Seleccionar la opcin "Aadir. En seguida volver a la parte de la izquierda la casilla debajo de Valor antiguo y en "Rango, valor hasta MAYOR ", anotar en el casillero el valor del percentil 75, en el ejemplo: 62, y en valor nuevo el nmero 2, Seleccionar nuevamente la opcin "Aadir. Luego volver a hacer click en "Continuar" y finalmente en "Aceptar".

d) Calcular las diferencias entre las medias de estos dos subgrupos para cada tem. Seguir esta secuencia: "Analizar" luego "Comparar medias" luego "Prueba T para muestras independientes" (Analizar/ Comparar medias/ Prueba T para muestras independientes).

Seleccionar y pasar todos los tems del instrumento de observacin que estamos valorando a la seccin "contrastar variables, y en variable de agrupacin, pasar continuando con el ejemplo que se esta utilizando la variable Subgrupo. Debajo de "variable de agrupacin" seleccionar la opcin "definir grupos y escribir en "Grupo 1" el valor 1, y en "Grupo 2" el valor 2, que son los numerales que hemos usado para codificar al subgrupo inferior y al superior. Hacer c1ick en "Continuar" y Finalmente en "Aceptar".

En el visor de SPSS se proporcionan los resultados. La primera tabla muestra la informacin descriptiva sobre cada comparacin.

Group Statistics Subgrupos 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 1,00 2,00 N 91 85 91 85 91 85 89 85 91 84 91 85 91 85 91 85 90 85 90 85 90 85 90 85 90 85 90 85 90 85 90 85 89 85 90 85 90 85 90 85 89 85 90 85 90 85 89 84 90 85 90 85 90 85 89 85 90 85 90 85 Mean 2,0440 2,4824 2,4286 2,6824 1,5714 2,1294 1,5955 2,4941 1,2308 1,9405 1,7033 2,5529 1,7363 2,1059 1,2418 2,2000 1,5000 2,5647 2,1444 2,4588 1,6667 2,7647 1,5000 2,5412 1,3444 2,6471 1,7444 2,5412 1,6333 2,8000 2,3667 2,8706 1,4494 2,6824 2,3556 3,1412 1,8667 3,0118 1,4444 2,6706 2,3708 2,8824 2,0444 2,6353 1,5556 2,5647 2,3708 2,9167 1,7444 2,5647 1,4333 2,6118 2,0222 2,7765 1,6292 2,5882 2,3333 3,0353 1,4778 2,3059 Std. Deviation ,75883 1,01901 ,80475 ,95384 ,81844 ,96100 ,73421 ,94647 ,47321 1,04537 ,80959 1,09660 ,75770 1,01211 ,52368 ,99762 ,72282 1,04023 ,93088 1,00656 ,79323 1,01942 ,65771 ,97043 ,47785 1,02011 ,75790 ,98262 ,75625 ,92324 1,03261 ,96100 ,69103 ,96624 ,99788 ,96551 ,72204 ,85209 ,58273 ,89160 ,96979 ,95633 ,91075 ,97403 ,75120 1,02872 1,00433 ,98431 ,74292 1,09596 ,63688 1,01294 ,95961 1,03942 ,88397 1,10512 ,98300 ,91868 ,69067 1,20538 Std. Error Mean ,07955 ,11053 ,08436 ,10346 ,08580 ,10424 ,07783 ,10266 ,04961 ,11406 ,08487 ,11894 ,07943 ,10978 ,05490 ,10821 ,07619 ,11283 ,09812 ,10918 ,08361 ,11057 ,06933 ,10526 ,05037 ,11065 ,07989 ,10658 ,07972 ,10014 ,10885 ,10424 ,07325 ,10480 ,10519 ,10472 ,07611 ,09242 ,06143 ,09671 ,10280 ,10373 ,09600 ,10565 ,07918 ,11158 ,10646 ,10740 ,07831 ,11887 ,06713 ,10987 ,10115 ,11274 ,09370 ,11987 ,10362 ,09965 ,07280 ,13074

TipoEsp1 TipoEsp2 TipoEsp3 TipoEsp4 TipoEsp5 TipoEsp6 TipoEsp7 TipoEsp8 TipoEsp9 TipoEsp10 TipoEsp11 TipoEsp12 TipoEsp13 TipoEsp14 TipoEsp15 TipoEsp16 TipoEsp17 TipoEsp18 TipoEsp19 TipoEsp20 TipoEsp21 TipoEsp22 TipoEsp23 TipoEsp24 TipoEsp25 TipoEsp26 TipoEsp27 TipoEsp28 TipoEsp29 TipoEsp30

Posteriormente se muestra una tabla con los anlisis de las comparaciones (Ver la hoja en 150%)

(1)
Levene's Test for Equality of Variances

Independent Samples Test t-test for Equality of Means

(2)
F TipoEsp1 Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances 21,390 Sig. ,000 t -3,251 -3,219 3,674 ,057 -1,912 -1,901 ,939 ,334 -4,156 -4,133 7,861 ,006 -7,016 -6,975 56,294 ,000 -5,860 -5,706 16,935 ,000 -5,874 -5,815 3,823 ,052 -2,754 -2,728 39,286 ,000 -8,053 -7,897 20,462 ,000 -7,899 -7,820 2,946 ,088 -2,146 -2,142 6,811 ,010 -7,977 -7,921 17,752 ,000 -8,349 -8,261 66,942 ,000 -10,914 -10,715 11,751 ,001 -6,025 -5,982 3,114 ,079 -9,167 -9,115 2,041 ,155 -3,337 -3,344 16,446 ,000 -9,715 -9,642 ,268 ,606 -5,288 -5,293 ,117 ,732 -9,609 -9,564 16,496 ,000 -10,827 -10,702 ,056 ,814 -3,502 -3,503 2,546 ,112 -4,147 -4,139 16,719 ,000 -7,440 -7,376 ,876 ,351 -3,608 -3,610 26,218 ,000 -5,824 -5,762 27,143 ,000 -9,267 -9,152 4,943 ,027 -4,991 -4,980 10,400 ,002 -6,335 -6,303 df 174 154,795 174 164,827 174 165,482 172 158,368 173 113,620 174 154,039 174 155,257 174 125,072 173 148,862 173 169,890 173 158,591 173 146,644 173 117,654 173 157,871 173 162,574 173 172,964 172 151,584 173 172,896 173 164,960 173 143,417 172 171,821 173 170,363 173 153,231 171 170,753 173 146,660 173 140,013 173 169,812 172 160,735

(4)
Sig. (2-tailed) ,001 ,002 ,058 ,059 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,007 ,007 ,000 ,000 ,000 ,000 ,033 ,034 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,001 ,001 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,001 ,001 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 Mean Difference -,43840 -,43840 -,25378 -,25378 -,55798 -,55798 -,89861 -,89861 -,70971 -,70971 -,84964 -,84964 -,36962 -,36962 -,95824 -,95824 -1,06471 -1,06471 -,31438 -,31438 -1,09804 -1,09804 -1,04118 -1,04118 -1,30261 -1,30261 -,79673 -,79673 -1,16667 -1,16667 -,50392 -,50392 -1,23291 -1,23291 -,78562 -,78562 -1,14510 -1,14510 -1,22614 -1,22614 -,51157 -,51157 -,59085 -,59085 -1,00915 -1,00915 -,54588 -,54588 -,82026 -,82026 -1,17843 -1,17843 -,75425 -,75425 -,95902 -,95902 Std. Error Difference ,13484 ,13618 ,13272 ,13349 ,13427 ,13500 ,12809 ,12882 ,12112 ,12438 ,14465 ,14612 ,13420 ,13550 ,11899 ,12134 ,13479 ,13615 ,14646 ,14679 ,13765 ,13863 ,12470 ,12604 ,11936 ,12157 ,13223 ,13320 ,12727 ,12799 ,15102 ,15071 ,12691 ,12786 ,14857 ,14843 ,11916 ,11973 ,11325 ,11457 ,14608 ,14604 ,14248 ,14275 ,13563 ,13682 ,15131 ,15122 ,14084 ,14235 ,12716 ,12876 ,15112 ,15147 ,15137 ,15214

95% Confidence Interval of the Difference Lower Upper -,70454 -,70740 -,51574 -,51736 -,82299 -,82453 -1,15144 -1,15305 -,94877 -,95611 -1,13514 -1,13829 -,63448 -,63728 -1,19310 -1,19838 -1,33075 -1,33373 -,60346 -,60415 -1,36973 -1,37183 -1,28731 -1,29026 -1,53819 -1,54337 -1,05772 -1,05981 -1,41787 -1,41941 -,80200 -,80138 -1,48342 -1,48554 -1,07886 -1,07859 -1,38030 -1,38149 -1,44968 -1,45260 -,79992 -,79983 -,87207 -,87264 -1,27685 -1,27945 -,84455 -,84438 -1,09825 -1,10158 -1,42942 -1,43299 -1,05252 -1,05325 -1,25781 -1,25948 -,17226 -,16939 ,00818 ,00979 -,29298 -,29143 -,64579 -,64418 -,47064 -,46330 -,56415 -,56099 -,10475 -,10196 -,72338 -,71811 -,79867 -,79568 -,02529 -,02461 -,82635 -,82425 -,79504 -,79209 -1,06703 -1,06186 -,53574 -,53365 -,91546 -,91392 -,20585 -,20646 -,98241 -,98029 -,49238 -,49265 -,90990 -,90870 -1,00261 -,99969 -,22322 -,22331 -,30963 -,30906 -,74145 -,73885 -,24721 -,24738 -,54227 -,53894 -,92744 -,92387 -,45597 -,45525 -,66023 -,65856

TipoEsp2

(3)
TipoEsp3

TipoEsp4

TipoEsp5

TipoEsp6

TipoEsp7

TipoEsp8

TipoEsp9

TipoEsp10

TipoEsp11

TipoEsp12

TipoEsp13

TipoEsp14

TipoEsp15

TipoEsp16

TipoEsp17

TipoEsp18

TipoEsp19

TipoEsp20

TipoEsp21

TipoEsp22

TipoEsp23

TipoEsp24

TipoEsp25

TipoEsp26

TipoEsp27

TipoEsp28

En esta tabla se muestran los resultados de dos pruebas sobre la diferencia entre los dos grupos. Una de las pruebas asume que la varianza de los dos grupos es igual. El estadstico de Levene prueba esta asuncin (las filas "equal variances assumed"). Si el valor de la significancia (el "Sig" debajo de la columna "Levene's test for equality of variances", o prueba de Levene para la igualdad de varianzas) es mayor a 0.05 entonces se puede asumir que los grupos tienen igualdad de varianzas; es decir que si no resulta significativa (si es > 0.05) entonces no tenemos elementos para rechazar la hiptesis nula (varianzas iguales), por lo cual se tiene que aceptar que tienen varianzas iguales, por lo tanto se tendr que leer la primera fila de resultados (la que asume varianzas iguales: "equal variances assumed"). En cambio, si la conclusin de Levene resultara significativa (si es < 0.05) entonces s se tendra elementos para rechazar la hiptesis nula, por lo tanto se tendr que leer la segunda fila de resultados (la que no asume varianzas iguales: "equal variances not assumed"). Luego de determinar cul de las filas es la que se deber leer, comprobar si el estadstico del grupo de columnas de la prueba t es significativo Sig. (2-talled), es decir, igual o inferior a 0.05. Si existen diferencias estadsticamente significativas entre las medias en ese tem del subgrupo inferior y superior, entonces el tem es capaz de discriminarlos. Lo que se ha tratado es de identificar tems que no discriminan o que lo hacen en menor grado. Interpretando los resultados de la segunda tabla en el ejemplo presentado se llegara a la conclusin que todos los tems de la escala discriminan bien, salvo el TipoEsp 2. Referencias bibliogrficas Muiz, J., Fidalgo, A.M., y otros (2005). Anlisis de los tems. Madrid: La Muralla. Morales Vallejo, P. y otros (2003). Construccin de escalas de actitudes tipo Likert. Madrid: La Muralla.

Procedimiento y utilizacin del SPSS: para obtener la "Fiabilidad por correlacin item-total y alfa de Cronbach"
Las acciones previas para preparar la base de datos (reemplazo de valores perdidos y recodificacin de tems de sentido negativo) es necesario realizarlas tal como en la tcnica anterior. En esta tcnica propiamente no se trata de la correlacin de cada tem con el total (o suma de todos los tems), sino de "la correlacin de cada tem con la suma de todos los dems" (o la correlacin de cada tem con el total menos el tem; suele denominarse "correlacin tem-total corregida"). Lo que se busca comprobar es en qu medida el puntuar alto en un tem supone de hecho obtener un total alto en el resto de la escala (en todos los dems tems). Estos coeficientes es necesario que sean al menos moderadamente confiables (o "distintos de cero" en la poblacin). Los tems con una mayor correlacin con el total (o mejor dicho, con la suma de todos los dems) son los que "tienen ms en comn" y por lo tanto podernos pensar que "miden lo mismo que los dems". Los tems con correlaciones muy bajas con respecto a las de los otros tems, tendran que ser eliminados del instrumento de evaluacin que se esta construyendo. Lo que realmente interesa no es la correlacin de cada tem con el total, sino la correlacin de cada tem con la suma de todos los dems. Esta tcnica esta tan automatizada que en el SPSS han sido integrados los procesos para probar en cada tem la "correlacin tem-total menos el tem" y simultneamente la " la confiabilidad total (alfa de Cronbach) de todo el test o escala si suprimimos ese tem" y con esta informacin es fcil evaluar qu tems se pueden eliminar para que se incremente la confiabilidad del instrumento que se esta construyendo. Para hacer esto slo hay que seguir la secuencia: "Analizar" luego "Escalas" luego "Anlisis de fiabilidad " (Analizar/ Escalas/ Anlisis de fiabilidad).

En el cuadro de dilogo seleccionar todos los tems que componen el instrumento de medicin, pasndolos a la ventana "elementos. Observar que por defecto en la opcin "modelo est seleccionado el coeficiente "Alfa" (se refiere al coeficiente Alfa de Cronbach para el clculo de la fiabilidad total del instrumento evaluado). Hacer click en el botn "Estadsticos y marcar la opcin "Escala si se elimina el elemento. Luego Continuar y por ultimo Aceptar. De este modo el SPSS ofrecer la correlacin tem-total para cada elemento, y simultneamente la confiabilidad segn el Alfa de Cronbach de una versin del instrumento evaluado en la que se hubiera suprimido el item en cuestion.

El primer resultado que ofrece el SPSS en el anlisis de fiabilidad total, tras completar el proceso anterior con los datos del instrumento evaluado en el ejemplo, es el coeficiente Alpha de Cronbach (Cronbachs Alpha) de 0.775.
Case Processing Summary N Cases Valid Excludeda Total 316 16 332 % 95,2 4,8 100,0
Reliability Statistics Cronbach's Alpha ,775 N of Items 30

a. Listwise deletion based on all variables in the procedure.

Los estudiosos de estas tcnicas proponen que el alfa mnimo aceptable tendra que estar alrededor del 0.70; un valor alrededor de 0.60 se considerara pequeo; y slo en el caso de instrumentos que necesitan ser muy certeros se exigira un coeficiente Alpha no menor de 0.80. Por lo cual, a la vista de los resultados obtenidos en el ejemplo, se observa que la fiabilidad del instrumento original con todos los tems (0.775) sera considerada alta. De la segunda tabla es necesario prestar atencin a las 2 ltimas columnas "correlacin elemento-total corregida" (Correct Item-Total Correlation) y "alfa de cronbach si se elimina el elemento" (Cronbachs Alphs if Item Deleted).

Item-Total Statistics Scale Mean if Item Deleted 63,0538 62,6930 63,5886 63,2690 63,7468 63,4241 63,3386 63,7089 63,3576 62,8671 63,2753 63,4019 63,4747 63,1044 63,0253 62,5728 63,3228 62,5854 62,8196 63,3196 62,5823 62,9652 63,3291 62,4778 63,2848 63,3544 62,7405 63,2215 62,5063 63,5823 Scale Variance if Item Deleted 101,765 102,766 101,386 97,721 99,504 100,213 102,383 98,455 98,408 103,081 98,987 98,609 97,666 99,345 97,618 101,966 97,324 101,170 97,634 98,091 102,009 101,716 99,701 102,250 100,801 97,950 100,523 98,935 101,419 100,860 Corrected Item-Total Correlation ,219 ,158 ,192 ,396 ,377 ,258 ,183 ,437 ,366 ,111 ,325 ,406 ,453 ,325 ,400 ,163 ,437 ,192 ,426 ,422 ,167 ,185 ,286 ,147 ,230 ,402 ,212 ,293 ,192 ,229 Cronbach's Alpha if Item Deleted ,772 ,775 ,774 ,764 ,766 ,771 ,774 ,763 ,765 ,778 ,767 ,764 ,762 ,767 ,763 ,775 ,762 ,774 ,762 ,763 ,775 ,774 ,769 ,776 ,772 ,764 ,773 ,769 ,774 ,772

TipoEsp1 TipoEsp2 TipoEsp3 TipoEsp4 TipoEsp5 TipoEsp6 TipoEsp7 TipoEsp8 TipoEsp9 TipoEsp10 TipoEsp11 TipoEsp12 TipoEsp13 TipoEsp14 TipoEsp15 TipoEsp16 TipoEsp17 TipoEsp18 TipoEsp19 TipoEsp20 TipoEsp21 TipoEsp22 TipoEsp23 TipoEsp24 TipoEsp25 TipoEsp26 TipoEsp27 TipoEsp28 TipoEsp29 TipoEsp30

En la Tercera Columna ("Correct Item-Total Correlation", o correlacin tem-total corregida) tenemos la correlacin de cada tem con la suma de todos los dems. Esta correlacin nos indica en qu medida el tem es discriminante, es decir, en qu medida el puntuar alto o bajo en ese tem est relacionado con puntuar alto o bajo en el total del instrumento. En los datos del ejemplo se ve que el TipoEsp10 es el que correlaciona mas bajo con el total, 0.111. En la Cuarta Columna ("Cronbachs Alpha if item Deleted", o alfa de cronbach si se elimina el elemento) se muestra la confiabilidad de toda la escala si suprimimos el tem. Puede apreciarse que si se eliminase el tem TipoEsp10 la fiabilidad aumentara levemente (de 0.775 a 0.778). y como hemos visto antes, el TipoEsp10 tiene una correlacin baja tem-total. Posiblemente este tem podra ser eliminado en una versin definitiva de la escala. El anlisis llega a brindar informacin sobre qu pasa si eliminamos un tem a la vez, pero no si eliminramos varios tems a la vez. Tambin conviene analizar los tems que tienen una mayor correlacin tem-total: dado que son los que mejor representan el constructo medido por el instrumento que se esta evaluando.

Se visto que usando este mtodo se obtiene simultneamente los datos de anlisis de tems y la confiabilidad de todo el instrumento de medicin, aunque lgicamente despus del anlisis de tems se calculara la fiabilidad (consistencia interna). Dado que la frmula ms apropiada es el coeficiente "a" (Alfa de Cronbach), lo que se va a hacer es calcular la fiabilidad con distintos subconjuntos de tems para quedarse finalmente con la seleccin de tems que ms convenza como versin definitiva del instrumento construido. La tcnica ser la siguiente: 1. Calcular el coeficiente de fiabilidad con todos los tems iniciales; 2. Eliminar los peores tems y volver a calcular la fiabilidad ... y as sucesivamente hasta quedarse con el conjunto de tems que de la mayor fiabilidad. Los datos de la frmula del Alfa de Cronbach van variando segn se van eliminando tems. Cada vez que se elimina algn tem es necesario contar la nueva puntuacin total que tendra a cada sujeto, pues se necesita conocer la varianza de los nuevos totales. 3. Cuando al eliminar tems se observa que baja la fiabilidad, se da por terminado el proceso. Al final se obtiene un subconjunto de tems que constituyen una escala con una fiabilidad ptima. Nota. Es viable tambin hacer el "procedimiento inverso": seleccionar los tems que mejor discriminan (mayor correlacin con el total o mayor diferencia entre los grupos extremos) y calcular su fiabilidad. Luego aadir algunos pocos tems (los que mejor discriminan de los que quedan) y recalcular la fiabilidad. Detenerse cuando la fiabilidad comienza a bajar. Esto se hace para instrumentos con poca cantidad de tems. Sobre la magnitud aceptable del coeficiente de confiabilidad no hay un criterio nico compartido, pero para una escala de actitudes convencional se puede considerar a 0.70 el valor mnimo. En realidad el valor mnimo deseable del coeficiente de fiabilidad depender del uso previsto del instrumento. No es lo mismo un instrumento que se utilizara en "investigacin bsica" (donde se puede aceptar valores alrededor de 0.60) que un instrumento que se utilizara en "la toma de decisiones" sobre sujetos concretos (para orientacin o diagnstico) en donde usualmente no se aceptan valores menores a 0.80 para evitar que sea muy alto el error tpico de la medicin. La inversin en tiempo, anlisis, confeccin y comparacin de versiones distintas del mismo instrumento puede depender del uso que se le pretenda dar al mismo. No es lo mismo construir un instrumento como un simple ejercicio acadmico o experiencia didctica, que desarrollarlo para aportar un feedback a un determinado grupo de sujetos, o bien para medir un rasgo que va a ser central en una tesis doctoral o en una investigacin que se piensa publicar en alguna revista indexada. En referencia a la relacin entre el anlisis de tems y la fiabilidad, conviene recordar la relacin entre la magnitud del coeficiente de fiabilidad y el nmero de tems, pues esto tambin puede ayudar a tomar decisiones durante el proceso de construccin del instrumento. No se puede garantizar que al primer intento se consiga un instrumento con una consistencia interna aceptable. Puede ser que con los tems considerados satisfactorios NO se llegue a un coeficiente de fiabilidad que parezca aceptable. Cabe aadir ms tems. Puede suceder que el instrumento conseguido contenga un excesivo numero de tems, y que interese reducir el nmero de tems manteniendo una confiabilidad satisfactoria. Existen varias situaciones en las que es conveniente modificar el nmero de tems (redactando nuevos tems que aumenten la fiabilidad): 1. Cuando an eliminando tems con correlaciones tem-total muy bajas la fiabilidad no llega a un valor adecuado. Los tems eliminados nos pueden llevar a concluir que el constructo fue inicialmente conceptualizado de forma muy genrica. Debido a ello es que

aparecen tems que no se relacionan bien con los dems, y no describen el supuesto rasgo comn a los dems tems. Entonces queda reforzar los tems que s funcionan redactando tems similares a los que funcionaron bien. 2. Cuando a modo de prueba se construy una escala con pocos tems pero que discriminan bien aunque la fiabilidad sea baja (tambin puede darse el caso que sea alta con pocos tems), Entonces puede ser necesario seguir perfilando el instrumento para aumentar la fiabilidad: ello supone construir nuevos tems siguiendo el mismo contenido temtico de los anteriores. 3. Puede suceder que se requiera disminuir el nmero de tems: cuando se tienen muchos tems con alta fiabilidad, pero se sabe que por motivos prcticos se necesita un instrumento ms breve (sin que disminuya mucho la fiabilidad). En este caso es necesario recurrir a la "frmula proftica" de Spearman-Brown, la cual permite calcular el nmero de tems necesarios para conseguir una fiabilidad de una determinada magnitud. Frmula "proftica" de Spearman-Brown Frmula 1.-Qu fiabilidad se alcanzara aumentando el nmero de tems en una determinada proporcin; la misma frmula sirve para estimar la fiabilidad aumentando o disminuyendo el nmero de tems. Frmula 2.-En cuntos tems se debera aumentar un instrumento, de una fiabilidad ya conocida y que parece adecuada, para conseguir un determinado coeficiente de fiabilidad previamente especificado. Ejemplos:
r nn (nueva fiabilidad estimada) =: ------------------------------------------------------------------------------ _ 1 + [(n)-1 (r 11)]
(n) (r 11 )

Frmula 1 Predice cunto aumentar la fiabilidad al multiplicar el nmero de tems por el factor "n". En esta frmula "n" es el factor por el que se multiplica el nmero de tems que ya se tiene, y r 11 es la fiabilidad ya obtenida. Ejemplo 1.- Si se tiene una escala de 10 tems; con fiabilidad 0.65, la cual parece baja. Interesara conocer cul ser el coeficiente de fiabilidad si se multiplica el nmero de tems por 2 (n=:2) y as llegar a 20 tems (10*2=20), que se supone deben haber sido redactados considerando el mismo contenido temtico de los que ya se tenan. Aplicando la frmula: A partir de la Frmula 1 se puede construir una tabla en la que se pueda visualizar a qu fiabilidad se puede llegar partiendo de una fiabilidad ya obtenida y multiplicando el nmero de tems que ya se tiene por el factor "n "
(2) (0.65)

r nn = -------------------,-- = .0788
1. + (2-1.)(.065)

Nota. - los "coeficientes ya obtenidos" no son todos los posibles, pues se trata de estimaciones que orientan sobre el aumento de fiabilidad esperado al multiplicar el nmero de tems por "n"
Coeficientes obtenidos de
= 0.50 = 0.60 = 0.70 = 0.80 = 0.90

fiabilidad

ya

Multiplicando el numero de tems por un factor n =


0.33 0.248 0.33 0.44 0.57 0.75 0.50 0.33 0.43 0.54 0.67 0.82 1.5 0.60 0.69 0.78 0.857 0.93 2 0.667 0.75 0.82 0.89 0.95 3 0.75 0.82 0.88 0.92 0.97

Ejemplo 2.- En el caso del ejemplo desarrollado con el SPSS se obtiene, con 12 tems, un alfa de 0.50 aproximadamente. Lo cual quiere decir que si se quiere llegar a un alfa de 0.75 se debera llegar a tener 36 items (12*3=36). Ejemplo 3.- si se tuviera 10 tems con una fiabilidad de 0.50, y se multiplicara el nmero de tems por 1.5 (10*1.5=15 tems) se podra esperar una fiabilidad de 0.60 Ejemplo 4.- si con 10 tems se tuviera una fiabilidad de 0.70, y se multiplicara el nmero de tems por 2 (10*2=20 tems), la fiabilidad esperada sera de 0.82 Si se quiere reducir el nmero de tems, el factor "n" tendra que ser inferior a la unidad (un medio=0.5; un tercio=0.33) y se disminuir la fiabilidad. Ejemplo 5.- si se tuviera 40 tems y una fiabilidad de 0.90, con la mitad de los tems (40*0.5=20 tems) se podra esperar una fiabilidad de 0.82, que seguira siendo muy aceptable. Ejemplo 6.- si se tuviera 40 tems de fiabilidad 0.90 y se quisiera reducir el instrumento a un tercio de ellos (40*0.33= 13) la fiabilidad estimada seria de 0.75 Frmula 2 Predice en cuntos tems se debera incrementar el instrumento para llegar a la fiabilidad deseada. En este caso se pregunta por el valor de "n" (el factor por el que se tiene que multiplicar el nmero de tems que ya se tienen)
n =: --------------------------------------------------------r11 (1-rnn)
En esta frmula:
(rnn) (1- r11 )

"n" r nn r 11

es el factor por el que multiplicamos el nmero de tems para conseguir una determinada fiabilidad; es la "fiabilidad deseada"; es la "fiabilidad ya obtenida" con el nmero original de tems.

Ejemplo 1.- Si con 10 tems se hubiera conseguido una fiabilidad 0.57 y se deseara llegar a una fiabilidad aproximada de rnn=0.75, por qu coeficiente "n" se tendra que multiplicar el nmero inicial de tems? Aplicando la frmula:
(0.75) (1-0.57)

n = -------------------,-- = 2.26
(0.57) (1-0.75)

Se necesitara por lo tanto 2.26*10=22.6 tems {redondeando 23 tems). Es decir ser necesario ms que duplicar el nmero de tems. Ejemplo 2.- Si con 3 tems se tuviera un coeficiente de fiabilidad de 0.57, para llegar a 0.75 de fiabilidad se necesitara 2.26*3=6.8 (unos 7 tems). Se entiende que es necesario que los nuevos tems sean muy parecidos a los tems originales. Ejemplo 3.- Si se tiene 20 tems con 0.40 de fiabilidad, se necesitara 120 tems para llegar a una fiabilidad de 0.80, esto no parece una buena alternativa, pues como recomiendan los conocedores:
Si el nmero de tems que se necesitara aumentar para alcanzar una fiabilidad que se considera aceptable es excesivo, esto se puede deber a que los tems del instrumento NO representan claramente un rasgo definido, y en esta circunstancia seria recomendable reiniciar la construccin desde la definicin conceptual de la variable.

Referencias bibliogrficas Botella, J. Y otros (2005). Anlisis de datos en Psicologa, 1. Madrid: Pirmide. Morales Vallejo, P. y otros (2003). Construccin de escalas de actitudes tipo Likert. Madrid: La Muralla.

Potrebbero piacerti anche