Validez y confiabilidad instrumentos medición

Mg.
IRMA LUZ YUPARI AZABACHE
Requisitos de
la Medicin
Validez
Validez de
Contenido
Validez de
Criterio
Confiabilidad
Validez de
Constructo
Factores Que Atentan Contra La Validez Y Confiabilidad
RELACIN ENTRE LA CONFIABILIDAD Y VALIDEZ

Un instrumento de medicin puede ser confiable pero no
necesariamente vlido (un aparato puede ser consistente en lo
resultados que produce pero puede no medir lo que pretende).
Tirador 1: Ni
confiabilida
d ni validez
Tirador 2:
Confiabilidad,
pero no validez
Tirador 3:
Confiabilidad y
validez
CONFIABILIDAD DEL INSTRUMENTO DE

RECOLECCIN DE DATOS:
La confiabilidad responde a la pregunta con cunta
exactitud los tems, reactivos o tareas representan al

universo de donde fueron seleccionados?.
Un cuestionario, es confiable cuando
su aplicacin
repetida al mismo sujeto u objeto, produce los mismos
resultados y es operativo cuando su vocabulario es
entendido en un sentido unvoco, o sea exactamente con
el significado definido por el diseador del instrumento.
Los procedimientos ms utilizados son:

1.
Test-retest( Medida de Estabilidad) Un mismo

instrumento es aplicado dos o ms veces a un mismo
grupo de personas en condiciones similares. Si la
correlacin entre los resultados de las diferentes
aplicaciones es altamente positiva, el instrumento se
considera confiable.
2.
Medidas paralelas o formas equivalentes (Dos

versiones diferentes pero equivalentes, se administra a
un mismo grupo de personas ).
3.
Divisin por mitades o mitades partidas (Una prueba

fragmentada en dos partes equivalentes).
4.
Alfa de Cronbach y Kuder Richarson
Mtodo
Nmero de veces
que el instrumento
es administrado
Nmero de
versiones
diferentes
del
instrumento
Nmero de
participantes que
proveen los datos
Estadstico a
usar
Responden
los individuos
de una manera
similar a un
instrumento si
se les
administra dos
veces?
Coeficiente
de
Correlacin
Cuando dos
versiones de
un
instrumentos
son similares
Hay
convergencia o
divergencia en
las respuestas
a ambas
versiones?
Coeficiente
de
Correlacin
Cada
participante
responde a cada
versin del
instrumento
Cuando dos
versiones de
un
instrumentos
son similares
Hay
convergencia o
divergencia en
las respuestas
a ambas
versiones?
Coeficiente
de
Correlacin
Cada
participante
responde a la
nica versin
Son las
puntuaciones
de una mitad
del
instrumento
similares a las
obtenidas en la
otra mitad?
Coeficiente
de
Correlacin
Cada
participante
responde a la
nica versin
Las
respuestas a
los tems del
instrumento
son
coherentes?
Coeficiente
de Alfa de
Cronbach y
de KR
Estabilidad
(test-retest)
Dos veces en
tiempos
distintos
Una
versin
Cada
participante
responde al
instrumento dos
veces
Formas
alternas
Dos veces al
mismo tiempo o
con una
diferencia muy
corta
Dos
versiones
diferentes
pero
equivalent
es
Cada
participante
responde a cada
versin del
instrumento
Formas
alternas y
pruebaposprueba
Dos veces en
tiempos
distintos
Dos
versiones
diferentes
pero
equivalent
es
Mitades
partidas
Una vez
Una
fragmenta
da en dos
partes
equivalent
es
Medidas de
consistencia
interna(alfa y
KR20 y21)
Una vez
Una
versin
Inquietud o
pregunta que
contesta
En este caso, el anlisis se realizo a travs del Alpha de Cronbach (10% de

la poblacin objeto de estudio ):
Para el puntaje de los tems, se utiliz la escala de Likert, de la siguiente
forma:
Totalmente De Acuerdo: 5 puntos
De Acuerdo: 4 puntos
Neutral: 3 puntos
En Desacuerdo: 2 puntos
Totalmente en Desacuerdo: 1 punto
Tabla: Escala de Valoracin del Alfa de Cronbach

Valor Alfa de Cronbach
Apreciacin
[0.95 a + >
[0.90 - 0.95>
[0.85 - 0.90>
[0.80 - 0.85>
[0.75 - 0.80>
[0.70 - 0.75>
[0.65 - 0.70>
[0.40 - 0.65>
[0.00 - 0.40>
Fuente: De Vellis (1991)
Muy elevada o Excelente

Elevada
Muy buena
Buena
Muy Respetable
Respetable
Mnimamente Aceptable
Moderada
Inaceptable
RESULTADOS DEL PROCESAMIENTO DE

CONFIABILIDAD
DEL
INSTRUMENTO
RECOLECCIN DE DATOS:
LA
DE
Estadsticos total-elem ento
Estadsticos de fiabilidad
Alf a de
Cronbach
.790
N de
elementos
10
Se alcanzo un Nivel de
Confiabilidad Muy
Respetable con un Alpha
= 0.79, siendo este test
consistente y adecuado
para el estudio
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
Media de la
escala si se
elimina el
elemento
35.3500
35.0000
34.9500
35.0000
35.0000
34.5500
35.0500
35.0500
34.9500
35.6500
Varianza de
la escala si
se elimina el
elemento
25.818
25.263
23.945
25.263
27.474
31.839
26.155
24.787
24.576
36.661
Correlacin
elemento-tot
al corregida
.637
.756
.829
.650
.595
.063
.677
.572
.623
-.363
Alfa de
Cronbach si
se eleimina
el elemento
.750
.738
.724
.747
.760
.806
.748
.756
.749
.879
Sin embargo se puede observar que si se elimina la pregunta 10, el

alfa de cronbach aumentara pero por decisin del autor se decidi
conservar la pregunta dado que era importante para el test.
Al comprobar la fiabilidad para los elementos con todos los datos

se obtiene lo siguiente:
Estadsticos total-el emento
Media de la
es cala si s e
elim ina el
elemento
Alf a de
Cronbach
Varianza de
la es c ala s i
s e elim ina el
elemento
Alf a de
C ronbach si
s e eleimina
el elem ent o
C orrelacin
elemento-t otal
c orregida
P1
31.6475
22.259
.549
.718
P2
31.3597
23.348
.520
.725
N de elem ent os
P3
31.4604
23.424
.535
.724
10
P4
31.7698
23.526
.513
.726
P5
31.5252
23.382
.439
.734
P6
31.5396
23.018
.464
.730
P7
31.7914
22.514
.544
.719
P8
31.8561
22.588
.423
.736
P9
31.8417
22.337
.490
.726
P10
32.4748
27.396
-. 055
.813
.756
Para la motivacin intrnseca:

Estadsticos total-el emento
Medi a de la
escal a si se
elimina el
elemento
Estadsticos de fiabi li dad

Alf a de
Cronbac h
.825
Var ianza de
la escala si
se eli mina el
elemento
Correlacin
elemento-total
cor regida
Alfa de
Cronbach si
se eleimi na
el elemento
P1
14.8921
7.256
.500
.829
N de element os
P2
14.6043
7.009
.710
.765
P3
14.7050
7.267
.673
.776
P4
15.0144
7.377
.633
.787
P5
14.7698
6.932
.614
.792
Para la motivacin extrnseca :

Estadsticos total-elemento
Alf a de
Cronbach
N de element os
.623
Media de la
escala si se
elim ina el
elemento
Varianza de
la escala si
se elim ina el
elemento
P6
13.0432
7.926
.338
.588
P7
13.2950
7.470
.456
.535
P8
13.3597
6.435
.548
.473
P9
13.3453
6.894
.499
.506
P10
13.9784
8.413
.120
.709
Estadsticos de la escala
Media
16.7554
Varianza
Desviacin tpica
N de elem entos
10.606
3.25675
Correlacin
elemento-t otal
corregida
Alf a de
Cronbach si
se eleimina
el elem ent o
En el caso de instrumentos con coeficientes de confiabilidad

moderados como en este caso (0.623), una manera de saber hasta
dnde los mismos pueden ser aceptables, consiste en comparar
la desviacin estndar de la distribucin de puntajes (Sy) con el
error estndar de medicin (EEM) (Carlos Ruiz Bolvar,), cuya
frmula es:
EEM = error estndar de medicin.

Sy = Desviacin estndar de la distribucin de puntajes totales.
rtt = Coeficiente de confiabilidad.
En estos casos se recurre al criterio del error estndar de
medicin para decidir sobre la aceptabilidad de un coeficiente de
confiabilidad moderado, se requiere que se cumpla la condicin
de que Sy > EEM.
Como se puede observar, en el caso
el EEM
(1.9045) no excede el valor de la Sy(3.257); es
decir, que se cumple la condicin de
aceptabilidad sealada anteriormente. (Sy >
EEM). En consecuencia, el instrumento puede
ser utilizado
VALIDEZ DEL INSTRUMENTO DE RECOLECCIN DE

DATOS:
- Segn Hernndez, la validez se refiere, al grado en que un
instrumento (cuestionario) realmente mide las variables que pretende
medir.
-Una pregunta es vlida si estimula informacin exacta y relevante.
-La seleccin y la redaccin influyen en la validez de la pregunta.
- Algunas preguntas que son vlidas para un grupo de personas,
pueden no serlo para otro grupo.
- Entre menos tenga que reflexionar el sujeto, ms vlida ser la
respuesta. La validez implica congruencia en la manera de plantear
las preguntas.
La validez puede ser :
De contenido
De criterio
De constructo
VALIDEZ DE CONTENIDO
Se refiere al grado en que el test presenta una muestra
adecuada de los contenidos a los que se refiere, sin
omisiones y sin desequilibrios de contenido.
La validez de contenido se utiliza principalmente con tests
de rendimiento, y especialmente con los tests educativos y
tests referidos al criterio. En este tipo de tests se trata de
comprobar los conocimientos respecto a una materia o un
curso.
La validez de contenido descansa generalmente en el
juicio de expertos (mtodos de juicio). Se define como el
grado en que los tems que componen el test representan
el contenido que el test trata de evaluar.
Para este anlisis se ha utilizado el programa Excel

Versin 2007,y se aplic
la tcnica estadstica
denominada Coeficiente de Proporcin de Rangos (CPR)
basado en el mtodo a juicio de expertos, que consiste
en un examen sistemtico de cada de uno de los tems preguntas del mismo, para determinar si miden las
variables que se espera medir, la pertinencia del
contenido, la claridad de los enunciados de cada uno de
ellos, y el nivel de concordancia entre los evaluadores.
Se sigui el siguiente procedimiento:
Se solicit la colaboracin de tres expertos de la carrera
de psicologa, con el objeto de determinar la pertinencia
de contenido de los tems del instrumento. Se les entreg
el cuestionario y la informacin necesaria y se obtuvo la
evaluacin del cuestionario de cada uno de los expertos.
TESIS: RELACIN ENTRE LA MOTIVACIN Y EL RENDIMIENTO

ACADMICO DEL CURSO DE ESTADSTICA EN ESTUDIANTES
DEL CUARTO CICLO DE LA FACULTAD DE DERECHO DE LA
UNIVERSIDAD CSAR VALLEJO EN EL SEMESTRE 2008-II
OBJETIVOS DE LA INVESTIGACION:
Objetivo General:
Determinar el nivel de relacin existente entre la motivacin de
los estudiantes de la facultad de derecho de la UCV y el
rendimiento acadmico del curso de estadstica.
Objetivos especficos:
Determinar el nivel de relacin existente entre la motivacin
intrnseca del alumno y el rendimiento acadmico en estadstica.
Determinar el nivel de relacin existente entre la motivacin
extrnseca
del alumno y
el rendimiento acadmico en
estadstica.
ANEXO B: VALIDACION DEL CUESTIONARIO

FORMATO PARA EVALUACIN DEL CUESTIONARIO
Datos del Evaluador:
Apellidos y Nombres: .
Nmero de Colegiatura:..
Profesin:.
Lugar de Trabajo:.
Cargo que desempea:
rea:
tems-
Objetivos
Escala Evaluativa
Preguntas
Especficos
1,2,3,4 y 5
6,7,8,9 y 10
Observaciones
C
ESCALA EVALUATIVA DE CORRESPONDENCIA ITEMS- OBJETIVOS:

A: TOTALMENTE DE ACUERDO
B: DE ACUERDO
C: DESACUERDO
La informacin proporcionada por cada uno de los expertos se

proces y analiz calculando el coeficiente de proporcin de
rango corregido.
TABLA B1: TABULACIN DE LOS DATOS RESPECTO A LA EVALUACIN
DEL INSTRUMENTO
ITEM
EVALUADORES
PREGUNTAS
1
1, 2, 3, 4, 5
II
6, 7, 8, 9, 10
Fuente: Clculos Propios
Puntaje escala Evaluativo de los tems:

A: Totalmente De Acuerdo : 3 puntos
B: De Acuerdo : 2 puntos
C: Desacuerdo: 1 punto
TABLA B2:
TABULACION SEGN ESCALA EVALUATIVA DE LOS ITEMS
ITEM
I
EVALUADORES
PREGUNTAS
1, 2, 3, 4, 5
II
6, 7, 8, 9, 10
Segn los especialistas, existe una muy alta validez y

concordancia de los mismos, esto se evidencia al calcular el
Coeficiente de Proporcin de Rango que alcanz un 87 %.
EVALUADORES
ITEM PREGUNTAS
I
1, 2, 3, 4, 5
II 6, 7, 8, 9, 10
TOTALES
1
3
3
6
Promedio de Rangos
Pr i
para cada tem
2
3
2
5
3
3
3
6
Proporcion
Promedio
de Rangos
S ri
9
8
0 17
ri
3
2.667
5.667
Pe
de cada item
1.00
0.89
1.89
0.037
0.037
0.074
ri
j
Proporcin de Rangos para cada tem i: Es el

promedio de rangos de cada tems individuo
P Pr i
dividido entre el puntaje mximo de la escala
evaluativo de los tems (coeficiente de validez de
cada tem)
Correccin:
J: Nmero de jueces : 3
Pr i
( k )
1
Pe
j
K= Numero
de rangos
de la escala
evaluativa
Coeficiente de Proporcin de Rangos:

P Pr i
CPR
N
1.89
CPR
2
CPR : 0.944
N= Numero de tems
Coeficiente de Proporcin de Rangos

Corregido :
INTERPRETACION
CPRc:
CPR - Pe
CPRc:
0.944-0.074
CPRc:
0.870
Muy Alta
Mayor que
Menor igual que
0
0.4
0.6
0.8
0.4
0.6
0.8
1
Validez y concordancia
Baja
Moderada
Alta
Muy Alta
VALIDEZ DE CONSTRUCTO
Se refiere al grado en que el instrumento de medida cumple
con las hiptesis que cabra esperar para un instrumento de
medida diseado para medir precisamente aquello que
deseaba medir. Se puede considerar un concepto general
que abarcara los otros tipos de validez.
El trmino constructo hace referencia a un concepto
terico psicolgico inobservable (ej. la inteligencia, cada
factor de personalidad, las aptitudes, las actitudes, etc.)
La definicin operativa de estos constructos presenta
considerables dificultades en la prctica, ya que no son
directamente observables. Debido a esto, la validacin de
un constructo es un proceso laborioso y difcil.
TECNICAS CORRELACIONALES
En resumen, las tcnicas correlacionales o de la o
consistencia interna relativa empleados en la validez
de constructo son procedimientos de correlacin
entre:
Item Test
Item Escala (Subtests)
Escala Test o Test Subtests
ESCALA DE VALORACIN PARA INTERPRETAR LA CORRELACIN EN LA VALIDACIN
ri.t
Nivel de discriminacin
0.40 a ms
0.30 0.39
0.20 0.29
0 0.19
Fuente: Elosua Oliden y Bully Garay ( 2012), Pg. 58.
Muy bueno
Bueno
Deficiente
Insuficiente
ANLISIS FACTORIAL
El anlisis factorial nos indica cmo tienden a
agruparse los tems o variables. Examinando el
contenido conceptual de los tems que pertenecen al
mismo factor podemos comprender qu factores [o
constructos] subyacentes explican las correlaciones
entre los tems. El anlisis factorial de un
instrumento de medicin ayuda a establecer la
validez de constructo de lo que estamos midiendo,
en el sentido de que nos analiza la estructura del
constructo que estamos pretendiendo medir.
EL ANLISIS DE COMPONENTES PRINCIPALES

Segn Johnson(2000),
el ACP comprende un
procedimiento matemtico que transforma un conjunto de
variables correlacionadas de respuesta en un conjunto
menor de variables no correlacionadas llamadas
componentes principales . Tambin menciona que la
mayora de libros sobre Mtodos Multivariados sugieren
que los objetivos principales de un ACP son :
1) Reducir la dimensionalidad de un conjunto de datos,
2) Identificar nuevas variables significativas subyacentes
Uriel, E. y Aldas (2005) plantean que el mtodo de
Componentes Principales tiene por objeto transformar
un conjunto de variables , a las que denominan
variables originales , en un nuevo conjunto de variables
denominadas componentes principales. Estas ltimas
se caracterizan por estar intercorrelacionadas entre s.
Agregan que como medida de la cantidad de
informacin incorporada en una componente se utiliza
su varianza.
PROCEDIMIENTO PARA HALLAR LOS

COMPONENTES PRINCIPALES
1.- Analizar si los datos cumplen con las condiciones
mnimas para la aplicacin de la prueba (Prueba KMO y
de Esfericidad de Bartlett)
2.- Hallar comunalidades, es decir , la proporcin de la
varianza del indicador que es explicada por los
componentes o factores comunes.
3.- Obtencin de los componentes principales.
4. Seleccin del Nmero de Componentes
5. Interpretacin de los Componentes
6.Aplicacin de los resultados al anlisis
Para realizar esta prueba es necesario analizar si los datos

cumplen las condiciones mnimas para la aplicacin de la
tcnica:
Podemos comprobar que se presenta una buena adecuacin

muestral a los datos, ya que el estadstico de Keiser-Meyer-Olkin
(KMO), que nos indica la proporcin de la varianza que tienen en
comn las variables analizadas, presenta un valor de 0,802,
coeficiente cercano a la unidad que es lo ms aconsejado para
este tipo de anlisis, y la prueba de esfericidad de Bartlett que
comprueba las variables estn correlacionadas. Esto nos indicara
una buena adecuacin de los datos a un modelo de anlisis
factorial.
KMO y prueba de Bartlett
Medida de adecuacin muestral de
Kaiser-Meyer-Olkin.
Prueba de esfericidad
de Bartlett
Chi-cuadrado
aproximado
gl
Sig.
.802
438.374
45
.000
TABLA :VARIANZA TOTAL EXPLICADA
EN EL GRFICO SE
PUEDE OBSERVAR
QUE EXISTEN 2
COMPONENTES CON
AUTOVALORES
SUPERIORES A 1
. Al llevar a cabo la rotacin de factores, encontramos que

los dos componentes con autovalores mayores a uno
explicaron el 55.01 % de la varianza total
TABLA MATRIZ DE COMPONENTES ROTADOS
Componente
PREGUNTAS
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
DIMENSIN
1
1
1
1
1
2
2
2
2
2
1
0.52
0.80
0.78
0.76
0.79
0.39
0.28
0.02
0.13
0.44
2
0.47
0.13
0.19
0.16
0.07
0.47
0.69
0.81
0.72
0.42
Las rotaciones son transformaciones lineales que facilitan la interpretacin sin alterar
la proporcin de varianza explicada por los factores
VALIDEZ DE CRITERIO
Se establece al validar un instrumento de medicin al
compararlo con algn criterio externo que pretende medir

lo mismo.
Si el criterio se fija en el presente de manera paralela se
habla de validez concurrente (los resultados se
correlacionan con el criterio en el mismo momento o punto
de tiempo).
Si el criterio se fija en el futuro se habla de validez
predictiva( ejem: una prueba para determinar la capacidad
gerencial de candidatos a ocupar puestos ejecutivos se
validara comparando los resultados con el desempeo
posterior de los ejecutivos)
Escala de valoracin del coeficiente de correlacin de Pearson

Valor de r
Grado de correlacin
-1.00
Correlacin negativa Perfecta
-0.90
Correlacin negativa Muy fuerte
-0.75
Correlacin Negativa Considerable
-0.50
Correlacin Negativa Media
-0.25
Correlacin Negativa dbil
0.00
No existe correlacin alguna entre las variables
+0.10
Correlacin Positiva Muy Dbil
+0.25
Correlacin Positiva Dbil
+0.5
Correlacin Positiva Media
+0.75
Correlacin Positiva Considerable
+0.90
Correlacin positiva Muy fuerte
+1.00
Correlacin positiva Perfecta
Hernndez, Fernndez y Baptista ( 2010)
Factores que pueden afectar la confiabilidad y la

Validez
La improvisacin. Algunas personas creen que elegir un
instrumento de medicin o desarrollar uno es algo fcil y que no
requiere de supervisin alguna.
La traduccin, an cuando adaptemos los trminos a nuestro
lenguaje no es ni remotamente validarlo.
La inadecuacin o falta de empata. Hay instrumentos que tienen
un lenguaje muy elevado para el entrevistado o no toma en cuenta
diferencias de sexo, edad, nivel ocupacional y educativo.
Las condiciones de aplicacin. El ruido, presionar para que una
persona conteste un instrumento largo en un perodo de tiempo
corto, el hambre o falta de motivacin para responder influir
negativamente en la validez y confiabilidad de la medida.
Los aspectos mecnicos. Que el instrumento tenga instrucciones
precisas, que se lea bien (si se trata de un cuestionario escrito), que
no le falten pginas, que haya un espacio adecuado para contestar.

Validez y confiabilidad instrumentos medición

Caricato da

Informazioni sul documento

Descrizione originale:

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Validez y confiabilidad instrumentos medición

Caricato da

Copyright:

Formati disponibili

Mg.

IRMA LUZ YUPARI AZABACHE

Factores Que Atentan Contra La Validez Y Confiabilidad

RELACIN ENTRE LA CONFIABILIDAD Y VALIDEZ

CONFIABILIDAD DEL INSTRUMENTO DE

exactitud los tems, reactivos o tareas representan al

Los procedimientos ms utilizados son:

Test-retest( Medida de Estabilidad) Un mismo

Medidas paralelas o formas equivalentes (Dos

Divisin por mitades o mitades partidas (Una prueba

Alfa de Cronbach y Kuder Richarson

En este caso, el anlisis se realizo a travs del Alpha de Cronbach (10% de

Tabla: Escala de Valoracin del Alfa de Cronbach

Muy elevada o Excelente

RESULTADOS DEL PROCESAMIENTO DE

Estadsticos total-elem ento

Sin embargo se puede observar que si se elimina la pregunta 10, el

Al comprobar la fiabilidad para los elementos con todos los datos

Para la motivacin intrnseca:

Estadsticos de fiabi li dad

Para la motivacin extrnseca :

En el caso de instrumentos con coeficientes de confiabilidad

EEM = error estndar de medicin.

Como se puede observar, en el caso

VALIDEZ DEL INSTRUMENTO DE RECOLECCIN DE

Para este anlisis se ha utilizado el programa Excel

TESIS: RELACIN ENTRE LA MOTIVACIN Y EL RENDIMIENTO

ANEXO B: VALIDACION DEL CUESTIONARIO

ESCALA EVALUATIVA DE CORRESPONDENCIA ITEMS- OBJETIVOS:

La informacin proporcionada por cada uno de los expertos se

Fuente: Clculos Propios

Puntaje escala Evaluativo de los tems:

Segn los especialistas, existe una muy alta validez y

Proporcin de Rangos para cada tem i: Es el

Coeficiente de Proporcin de Rangos:

Coeficiente de Proporcin de Rangos

Menor igual que

EL ANLISIS DE COMPONENTES PRINCIPALES

PROCEDIMIENTO PARA HALLAR LOS

Para realizar esta prueba es necesario analizar si los datos

Podemos comprobar que se presenta una buena adecuacin

TABLA :VARIANZA TOTAL EXPLICADA

Fuente: Clculos Propios

. Al llevar a cabo la rotacin de factores, encontramos que

Fuente: Clculos Propios

compararlo con algn criterio externo que pretende medir

Escala de valoracin del coeficiente de correlacin de Pearson

Factores que pueden afectar la confiabilidad y la

Potrebbero piacerti anche