FIABILIDAD

FIABILIDAD :
Un test es un instrumento cientfico en la medida en que mide lo que pretende, es decir, es vlido, y mide bien, o sea, es preciso o fiable. Si nos encontramos con un instrumento del que no podemos fiarnos de las medidas que proporcionan, ya que varan de una vez a otra cuando medimos el mismo objeto entonces diremos que no es fiable. Un instrumento, para medir correctamente algo, ha de ser preciso, porque de no ser as, mida lo que mida, lo medir mal. Por lo tanto, ser preciso es una condicin necesaria pero no suficiente. Adems, ha de ser vlido, es decir, que lo que mide con precisin sera lo que se pretende medir, y no otra cosa. 1.-Fiabilidad absoluta y relativa : Podemos abordar el problema de la fiabilidad de un test de dos formas distintas, aunque en el fondo coincidentes : 1.1. La fiabilidad como la inexactitud de sus medidas : Cuando un sujeto responde a un test obtiene una puntuacin emprica, que est afectada por un error. Si no hubiera error alguno, el sujeto obtendra su puntuacin verdadera. El test es impreciso porque la puntuacin emprica no coincide con la autntica puntuacin verdadera. Esta diferencia entre ambas puntuaciones es el error muestral, el error de medida. El error tpico de medida ser la desviacin tpica de los errores de medida. El error tpico de medida indica la precisin absoluta del test, ya que permite estimar la diferencia entre la medida obtenida y la que se obtendra si no hubiera error. 1.2. La fiabilidad como la estabilidad de las medidas: Un test ser ms fiable cuanto ms constantes o estables se mantengan los resultados que proporciona cuando se repite. Cuanto ms estables sean los resultados en dos ocasiones, mayor ser la correlacin entre ellos. A esta correlacin se le denomina coeficiente de fiabilidad. ste nos expresa, no la cuanta del error, sino la coherencia del test consigo mismo y la constancia de la informacin que ofrece. El coeficiente de fiabilidad expresa la fiabilidad relativa del test. 2.- El coeficiente de fiabilidad y el ndice de fiabilidad : - El coeficiente de fiabilidad de un test es la correlacin del test consigo mismo, obtenida por ejemplo, en dos formas paralelas: rxx. - El ndice de precisin es la correlacin entre las puntuaciones empricas de un test y sus puntuaciones verdaderas : rxv El ndice de precisin siempre ser mayor que el coeficiente de fiabilidad Para averiguar el coeficiente de fiabilidad son de destacar estos tres mtodos clsicos: 2.1.- Ha llar la correlacin entre el test y su repeticin : El mtodo de la repeticin o mtodo del test-retest : Consiste en aplicar el mismo test al mismo grupo en dos ocasiones y se calcula la correlacin entre las dos series de puntuaciones. Dicha correlacin es el coeficiente de
fiabilidad. Este mtodo suele dar un coeficiente de fiabilidad ms alto que los obtenidos por otros procedimientos, y puede estar contaminado por los factores perturbadores. 2.2. Hallar la correlacin entre dos formas paralelas del test : El mtodo de las formas paralelas : Se preparan dos formas paralelas del mismo test, es decir, dos formas equivalentes que den la misma informacin, y se aplican al mismo grupo de sujetos. La correlacin entre las dos formas es el coeficiente de fiabilidad. Con este mtodo, al no repetirse el mismo test, se evitan las fuentes perturbadoras de la fiabilidad del re-test. 2.3.Hallar la correlacin entre dos mitades paralelas del test : El mtodo de las dos mitades : Se divide el test en dos mitades equivalentes y se halla la correlacin entre stas. Es el mtodo preferible, ya que es sencillo y soslaya las limitaciones de los procedimientos anteriores. Se pueden elegir los elementos impares del test, para constituir una mitad, y los elementos pares para constituir la otra. 3.- El coeficiente de fiabilidad y la correlacin entre tests paralelos : El coeficiente de fiabilidad de un test indica la proporcin que la varianza verdadera es de la varianza emprica : grfico33
El coeficiente de fiabilidad de un test vara entre 0 y 1 . Por ejemplo: si la correlacin entre dos tests paralelos es rxx = 0'80, significa que el 80% de la varianza del test se debe a la autntica medida, y el resto, es decir, el 20% de la varianza del test se debe al error. El ndice de fiabilidad de un test es la correlacin entre sus puntuaciones empricas y sus puntuaciones verdaderas
ndice fiabilidad = El ndice de fiabilidad es igual a la raz cuadrada del coeficiente de fiabilidad Una vez elaboradas dos formas paralelas de un test, se aplica el procedimiento del anlisis de varianza para comprobar la homogeneidad de las varianzas y la diferencia entre las medidas. Si las varianzas son homogneas, la diferencia entre las medias no es significativa y las dos formas estn construidas con el mismo nmero de elementos del mismo tipo y contenido psicolgico, puede afirmarse que son paralelas. Si no es asi, hay que reformarlas hasta que lo sean. La ausencia de fiabilidad se identifica con el valor rxx= 0
4.- El error tpico de medida : La diferencia entre la puntuacin emprica y la verdadera es el error aleatorio, llamado error de medida. La desviacin tpica de los errores de medida recibe el nombre de error tpico de medida. El error tpico de medida permite hacer estimaciones acerca de la fiabilidad absoluta del test, o sea, estimar cunto error de medida afecta a una puntuacin. 5.- Fiabilidad y longitud : La longitud del test se refiere al nmero de sus elementos. De esta longitud depende su fiabilidad. Si un test consta de tres elementos, un sujeto puede obtener en una ocasin una puntuacin de 1 y en otra, o en una forma paralela, una puntuacin de 2. De una ocasin a otra, la puntuacin han variado un punto; un punto sobre tres es una variacin del 33%, una variacin elevada. Si los sujetos obtienen variaciones casuales de este tipo, la correlacin del test consigo mismo o la de las dos formas paralelas del test, ser rebajada enormemente y no podr ser alta. Si el test es mucho ms largo, si tiene, por ejemplo, 100 elementos, un sujeto puede obtener 70 puntos en una ocasin y 67 en una forma paralela. De una a otra vez ha variado 3 puntos; es una varianza relativamente pequea en relacin con el test total, concretamente el 3%. Estas pequeas alteraciones casuales de esta magnitud, que se producen en las puntuaciones de los sujetos, al pasar de una forma a la paralela, son relativamente poco importantes y no disminuirn tanto como antes la correlacin entre ambas. El coeficiente de fiabilidad ser mucho mayor que en el caso anterior. La ecuacin de Spearman-Brown expresa la relacin entre la fiabilidad y la longitud.[R] La precisin de un test es nula cuando la longitud es 0, y va aumentando a medida que aumenta la longitud. Aunque el aumento es relativamente menor a medida que la longitud de que se parte es mayor. Esto significa que la precisin crece mucho al principio y relativamente menos despus. Cuando la longitud tiende a infinito, el coeficiente de fiabilidad tiende a 1. Al aumentar la longitud de un test, se incrementa su precisin porque aumenta la varianza verdadera a un ritmo ms alto que la varianza error. Esto supone que la precisin del test aumenta porque disminuye la proporcin de varianza que se debe al error. La frmula de Rulon, as como la frmula de Flanagan y Guttman, son especialmente aplicables cuando se calcula el coeficiente de fiabilidad por el mtodo de las dos mitades. Se trata de frmulas que se utilizan para el clculo del coeficiente de fiabilidad. 6.- Fiabilidad y consistencia:
El coeficiente de fiabilidad se puede hallar tambin de otra forma, es el denominado coeficiente alfa ocoeficiente de generalizabilidad o de representatividad (Cronbach). Este coeficiente alfa indica la precisin con que algunos items miden un aspecto de la personalidad o la conducta. Puede interpretarse como :

Una estimacin de la correlacin media de todos los items posibles en cierto aspecto. Una medida de la precisin del test en funcin de su coherencia o consistencia interna (interrelacin entre sus elementos; hasta qu punto los elementos del test estn midiendo todos lo mismo) y de su longitud. Indicando la representatividad del test, es decir, la cuanta en que la muestra de items que lo compone es representativa de la poblacin de items posibles del mismo tipo y contenido psicolgico.
El coeficiente alfa refleja principalmente, dos conceptos bsicos en la precisin de un test :

1. La interrelacin existente entre sus elementos: la medida en que todos miden bien una misma cosa. 2. La longitud del test : al aumentar el nmero de casos de una muestra, y si se eliminan los errores sistemticos, la muestra representa mejor a la poblacin de que se extrae y es ms improbable que intervenga el error casual.
Si los items del test son dicotmicos, (si o no, 1 o 0, acuerdo o desacuerdo, etc), la ecuacin del coeficiente alfa se simplifica, dando lugar a las ecuaciones de KuderRichardson (KR20 y KR21). Dado un cierto nmero de items, un test ser tanto ms fiable, cuando ms homogneo sea. El coeficiente alfa nos indica la fiabilidad en cuanto sta representa homogeneidad y coherencia o consistencia interna de los elementos de un test. 7- Normas y criterios de fiabilidad :7.1.- Segn el modelo del espacio muestral de items, el objetivo del test es estimar la medida que se obtendra si se usaran todos los items del espacio muestral. Esta medida sera la puntuacin verdadera, a la cual se aproximan ms o menos las medidas reales. Segn el grado en que una muestra de items correlacione con las puntuaciones verdaderas, el test es ms o menos fiable. En este modelo es central la matriz de correlaciones entre todos los items del espacio muestral.Este modelo muestral insiste ms directamente en la consistencia interna, y en la medida en que la logra, garantiza indirectamente la estabilidad. 7.2.- El modelo lineal de los tests paralelos insiste ms en la estabilidad de las puntuaciones, y en la medida en que consigue la estabilidad, favorece indirectamente la consistencia interna. Si aplicamos un test para establecer diagnsticos y pronsticos individuales, el coeficiente de fiabilidad debe ser de 0'90 para arriba. En pronsticos y clasificaciones colectivas, no es tanta la exigencia, aunque no es conveniente alejarse mucho de 0'90
a 0'80. A veces, en cierta clase de tests, como los de personalidad, resulta difcil lograr coeficientes de ms de 0'70. Si se aplica las formas paralelas, o mitades paralelas, despus de un intervalo ms o menos grande, los errores casuales pueden ser ms numerosos que los que afectan al coeficiente alfa. Esto es as porque lo que rebaja la correlacin no son slo los errores aleatorios intrnsecos al test y en una nica ocasin, que son los que tiene en cuenta el coeficiente alfa, sino que adems influyen todos los errores que pueden proceder de las dos situaciones distintas, que pueden diferir en numerosos detalles. Por ello, el coeficiente alfa suele ser mayor que los dems coeficientes. A excepcin del coeficiente hallado mediante la repeticin del mismo test, ya que hay ms probabilidad de que los errores aleatorios de la primera aplicacin se repitan en la segunda, y en vez de disminuir la correlacin entre ambas, la aumenten. Se ha de procurar que la segunda aplicacin sea por completo independiente de la primera. Si logramos esto, ste ser el mtodo ms fcil y econmico y aconsejable al intentar apreciar la estabilidad de las puntuaciones, sobre todo durante largos peridos de tiempo y con tests complejos.
VALIDEZ :
Si un test sirve para lo que con l se pretende, decimos que es vlido. Por ejemplo, un test de inteligencia es vlido si mide la inteligencia. Los tests son vlidos en la medida en que miden lo que dien medir. Podemos dintinguir entre la validez aparente y la validez comprobada : 1.- Validez aparente : hace referencia al grado en que el test parece que mide lo que quiere medir. 2.- Validez comprobada : es la que ha sido verificada de alguna forma emprica o experimental. La validez comprobada es emprica o terica : 3.- Validez emprica : es emprica cuando se ha comprobado de modo prctico. Por ejemplo, un test para seleccionar conductores es vlido si distingue a los buenos de los malos conductores, a pesar de no saber exactamente por qu lo consigue. 4.- Validez terica : refleja el grado en que se ha comprobado con argumentos cientficos que el test mide la propiedad o rasgo que intenta medir. Por ejemplo, un test de inteligencia tendr validez terica cuando exista una prueba de ello que se apoye en una verificacin lgica y experimental. 1.- La validez aparente : Un test tiene validez aparente si parece que mide lo que intenta medir.

No es una validez suficiente, aunque a menudo es necesaria. Muchas veces, conviene que el test les parezca vlido a los sujetos que han de contestarlo. En otras ocasiones, es fundamental que el test no parezca que mide lo que mide. ste es el primer requisito de la validez efectiva. Para conseguir sta no es suficiente con que el test parezca vlido, es preciso que se compruebe que lo es.
2.- La validez comprobada: La validez efectiva es la validez comprobada. Existen muchos modos de comprobar la validez unos son empricos y otros lgico-experimentales. 2.1.- La validez emprica o de criterio : Un test tiene validez emprica si se ha comprobado que sirve para alguna finalidad prctica. Por ejemplo, un test es vlido para seleccionar conductores si distingue los diferentes grados de pericia en la conduccin. La validez emprica tambin se denomina validez de criterio, y para comprobarla, se debe definir un criterio externo de validez. En el ejemplo comentado el criterio externo es la pericia en la conduccin. El coeficiente de validez del test es la correlacin entre el test y el criterio. Si los mejores en el test son los que conducen mejor, el test tendr un alto coeficiente de validez respecto a ese criterio, y tendremos un test empricamente vlido para seleccionar conductores. Esta validez es cientficamente ciega, porque no sabemos en qu se basa la validez del test. El test es vlido para seleccionar conductores, no sabemos por qu. La validez emprica puede clasificarse en : 1. Validez prospectiva o predictiva o de pronstico :
Es la que se comprueba mediante la correlacin entre el test y un criterio medido ulteriormente. Por ejemplo, si tenemos muchos aspirantes a pilotos y queremos seleccionar a los que tengan ms probabilidad de convertirse, pasados los estudios y prcticas, en buenos pilotos. Podemos aplicarles ciertos tests que aprecien los requisitos de ser buen piloto, y admitir a todos los aspirantes. Despus de los estudios y las prcticas oportunas, mediremos a los sujetos en el criterio que garantice ser un buen piloto. Si los tests contestados por los sujetos en el momento de la admisin tienen una alta correlacin con la pericia como piloto, medida despus del aprendizaje, a lo mejor aos despus, se puede afirmar que estos tests tienen alta validez prospectiva. Esta validez se ha llamado validez prospectiva, predictiva y de pronstico, ya que permite pronosticar o predecir convenientemente los resultados de los sujetos en el criterio, sirve para seleccionar a los aspirantes que con ms probabilidad van a ser buenos pilotos. 2. Validez inspectiva o concomitante o concurrente : Generalmente resulta demasiado costoso someter a prueba la validez predictiva; suele estar fuera de las posibilidades prcticas del psiclogo. Por ello, con frecuecia se recurre al mtodo de la validez inspectiva, concomitante o concurrente. Es igual que el procedimiento anterior pero los tests y el criterio se miden en el mismo periodo concomitante o concurrentemente. Por ejemplo, se escoge una muestra oportuna de pilotos, se les aplica los tests oportunos y se les mide en el criterio de pericia. El coeficiente de validez concomitante ser la correlacin entre los tests y el criterio. Nos informa hasta qu punto los buenos y los malos en el test son, en este momento, buenos y malos en el criterio. No nos garantiza que los aspirantes con mejores resultados en los tests despus sean los mejores pilotos. 3. Validez retrospectiva : Es la correlacin entre los tests, aplicados en cierto momento, y un criterio que se midi anteriormente, a lo mejor, aos antes. Su finalidad es pronosticar un criterio pasado, para averiguar desde el presente los factores y las condiciones que en el pasado influyeron en los sujetos, y que explican algunas de las caractersticas actuales de los sujetos. 2.2.-La validez terica : Un test tiene validez terica si mide lo que pretende medir. La cuanta en que lo mide est sealada por argumentos lgicos y experimentales que equivalen a su relacin con un criterio interno. Existen diversos tipos de validez terica, y son los siguientes : 1.Validez de contenido o muestral : Principalmente, hace referencia a tests de rendimiento, conocimientos o competencia profesional.
Por ejemplo, un test de ortografa es vlido si su contenido es apropiado. Para comprobar esta validez se examinar el campo de la ortografa y se constatar que los items que componen el test son una muestra imparcial y suficiente de este campo. Este tipo de validez no puede concretarse en ningn tipo de correlacin. Expresa la relacin entre el test y el criterio interno formado por la materia a que se refiere el test. La relacin ser ms alta a medida que est mejor representada toda la materia por el test. Esta validez se consigue a medida que hay garantias de que se han definido claramente los diversos aspectos de un cierto campo de conocimientos o destrezas que el test intenta medir. Criticar la validez muestral de un test implica mostrar que no representa adecuadamente el campo a que se refiere. 2. Validez de constructo o conceptual : Consiste en comprobar, segn la metodologa de la investigacin cientfica, que el test mide la variable a que se refiere. Se persigue garantizar cientficamente que la variable que el test intenta medir es una variable aceptable, cuyo concepto presenta suficiente consistencia lgica dentro del sistema terico de la psicologa y se apoya en suficientes comprobaciones experimentales que lo verifican. Por ejemplo, antes de ofrecer un test vlido para medir la inteligencia, habr que aclarar qu es esa inteligencia que el test intenta medir. 3. Validez factorial : Se produce cuando se corelacionan distintos tests con un rasgo determinado y despus se someten a una relacin factorial. 4. Validez congruente : Si medimos distintas variables con tests del mismo tipo, los tests que hacen referencia a una variable han de guardar entre s correlaciones ms altas que las que tienen con los tests de otras variables. 5. Validez discriminativa : Si medimos distintas variables con tests del mismo tipo, y la misma variable con tests de distinto tipo, estos tests de distinto tipo que hacen referencia a la misma variable han de tener entre si correlaciones ms altas que los tests del mismo tipo que hacen referencia a distintas variables. 6. Validez estructural : Es el grado en que el test mide una elaboracin o un rasgo terico. Cualquier dato que d algo de informacin sobre la naturaleza del rasgo que estamos considerando y de las condiciones que afectan a su desarrollo y manifestaciones tiene utilidad para este tipo de validez.
TIPICIDAD :
Una puntuacin x = 50, en un test de inteligencia indicar una inteligencia media, superior o inferior, segn se aproxime a la media del grupo normativo o se aleje de ella. Se ha de averiguar la posicin exacta que ocupa en la distribucin del grupo. Para esto se transforma la puntuacin obtenida en el test (puntuacin directa), en otra que indique dicha posicin (puntuacin tipificada). Existen varios modos de transformar las puntuaciones directas en puntuaciones tipificadas. Los tipos ms importantes de puntuaciones tipificadas son tres : puntuaciones cronolgicas, puntuaciones centiles y puntuaciones tpicas. 1.- Normas cronolgicas : El CI es el cociente entre la EM y la edad cronolgica, EC, normalmente multiplicada por 100. Algunos inconvenientes son :
Un ao de edad mental no significa lo mismo a lo largo del desarrollo, ya que significa mucho ms al principio que despus; p. ej. 1 ao de desarrollo mental entre los 3 y los 4 aos es equivalente a los 3 aos de desarrollo mental entre los 9 y los 12. Todos los tests poseen una edad tope, a partir de la cual las siguientes edades obtienen la misma puntuacin media, y por eso desde esa edad en adelante los conceptos de EM y de CI no tienen aplicacin. Su elaboracin es muy difcil, ya que se ha de conseguir que las distribuciones del CI de todas las edades tengan la misma forma, la misma media y la misma variabilidad; de no ser as la significacin de un mismo CI vara segn la edad. No se pueden aplicar a las caractersticas que no tienen un desarrollo sistemtico, o que alcanzan rpidamente la madurez, por ejemplo, la introversin no crece o decrece sistemticamente con la edad. No son rigurosamente aplicables en tests que estan destinados nicamente a poblaciones adultas.
En la actualidad, las normas cronolgicas se emplean casi exclusivamente con tests de inteligencia general y poblaciones infantiles. 2.- Normas centiles : La puntuacin centil de un sujeto en un test seala el tanto por ciento de sujetos de la poblacin normativa a que dicho sujeto es superior en ese test. Por ejemplo, si un sujeto ocupa el centil 90, es superior al 90% de los sujetos que forman la poblacin representada por el grupo normativo. Si ocupa el centil 10 ser superior al 10%. Con los percentiles se empieza a contar por abajo, de forma que cuanto ms bajo sea el percentil peor ser la posicin del individuo. El percentil 50 (P50) corresponde a la mediana. Los percentiles por encima de 50 representan ejecuciones superiores al promedio, y los que se encuentran por debajo de 50, ejecuciones inferiores. El percentil 25 y el 75 se llaman cuartiles primero y tercero, respectivamente (Q1 y Q3).
Los percentiles se pueden emplear lo mismo con adultos que con nios y sirven para cualquier tipo de tests, mide aptitudes o personalidad. La principal desventaja de las puntuaciones percentiles es la gran desigualdad de sus unidades, sobre todo en los extremos de la distribucin.3.- Normas tpicas : Estas normas nos sirven para evitar los inconvenientes de las normas anteriores. Son las normas que interpretan una puntuacin refirindola a la media del grupo normativo y utilizan como unidad de comparacin la desviacin tpica (dt = s) o alguna fraccin de sta. Las normas tpicas ms sencillas consisten en convertir las puntuaciones directas x en puntuaciones tpicas z :
grfico35
Una puntuacin tpica indica la distancia que separa a un sujeto de la media de su grupo, medida esta distancia empleando la desviacin tpica del grupo como unidad. Por ejemplo, sea una puntuacin tpica de 1'5; esta Z nos indica:

1. Que el sujeto es superior a la media de su grupo. 2. Que es superior en una desviacin tpica y media.
Un inconveniente de estas normas es que tienen el cero en el centro de la escala y sta comprende slo aproximadamente unas cinco unidades. En la distribucin normal entre -2'5 s y 2'5 s se sita aproximadamente el 99% de los casos.

FIABILIDAD

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

FIABILIDAD

Caricato da

Copyright:

Formati disponibili

FIABILIDAD :

El coeficiente alfa refleja principalmente, dos conceptos bsicos en la precisin de un test :

Potrebbero piacerti anche