Sei sulla pagina 1di 43

Mg.

IRMA LUZ YUPARI AZABACHE

Requisitos de
la Medicin

Validez

Validez de
Contenido

Validez de
Criterio

Confiabilidad

Validez de
Constructo

Factores Que Atentan Contra La Validez Y Confiabilidad

RELACIN ENTRE LA CONFIABILIDAD Y VALIDEZ


Un instrumento de medicin puede ser confiable pero no
necesariamente vlido (un aparato puede ser consistente en lo
resultados que produce pero puede no medir lo que pretende).

Tirador 1: Ni
confiabilida
d ni validez

Tirador 2:
Confiabilidad,
pero no validez

Tirador 3:
Confiabilidad y
validez

CONFIABILIDAD DEL INSTRUMENTO DE


RECOLECCIN DE DATOS:
La confiabilidad responde a la pregunta con cunta

exactitud los tems, reactivos o tareas representan al


universo de donde fueron seleccionados?.
Un cuestionario, es confiable cuando

su aplicacin
repetida al mismo sujeto u objeto, produce los mismos
resultados y es operativo cuando su vocabulario es
entendido en un sentido unvoco, o sea exactamente con
el significado definido por el diseador del instrumento.

Los procedimientos ms utilizados son:


1.

Test-retest( Medida de Estabilidad) Un mismo


instrumento es aplicado dos o ms veces a un mismo
grupo de personas en condiciones similares. Si la
correlacin entre los resultados de las diferentes
aplicaciones es altamente positiva, el instrumento se
considera confiable.

2.

Medidas paralelas o formas equivalentes (Dos


versiones diferentes pero equivalentes, se administra a
un mismo grupo de personas ).

3.

Divisin por mitades o mitades partidas (Una prueba


fragmentada en dos partes equivalentes).

4.

Alfa de Cronbach y Kuder Richarson

Mtodo

Nmero de veces
que el instrumento
es administrado

Nmero de
versiones
diferentes
del
instrumento

Nmero de
participantes que
proveen los datos

Estadstico a
usar

Responden
los individuos
de una manera
similar a un
instrumento si
se les
administra dos
veces?

Coeficiente
de
Correlacin

Cuando dos
versiones de
un
instrumentos
son similares
Hay
convergencia o
divergencia en
las respuestas
a ambas
versiones?

Coeficiente
de
Correlacin

Cada
participante
responde a cada
versin del
instrumento

Cuando dos
versiones de
un
instrumentos
son similares
Hay
convergencia o
divergencia en
las respuestas
a ambas
versiones?

Coeficiente
de
Correlacin

Cada
participante
responde a la
nica versin

Son las
puntuaciones
de una mitad
del
instrumento
similares a las
obtenidas en la
otra mitad?

Coeficiente
de
Correlacin

Cada
participante
responde a la
nica versin

Las
respuestas a
los tems del
instrumento
son
coherentes?

Coeficiente
de Alfa de
Cronbach y
de KR

Estabilidad
(test-retest)

Dos veces en
tiempos
distintos

Una
versin

Cada
participante
responde al
instrumento dos
veces

Formas
alternas

Dos veces al
mismo tiempo o
con una
diferencia muy
corta

Dos
versiones
diferentes
pero
equivalent
es

Cada
participante
responde a cada
versin del
instrumento

Formas
alternas y
pruebaposprueba

Dos veces en
tiempos
distintos

Dos
versiones
diferentes
pero
equivalent
es

Mitades
partidas

Una vez

Una
fragmenta
da en dos
partes
equivalent
es

Medidas de
consistencia
interna(alfa y
KR20 y21)

Una vez

Una
versin

Inquietud o
pregunta que
contesta

En este caso, el anlisis se realizo a travs del Alpha de Cronbach (10% de


la poblacin objeto de estudio ):
Para el puntaje de los tems, se utiliz la escala de Likert, de la siguiente
forma:
Totalmente De Acuerdo: 5 puntos
De Acuerdo: 4 puntos
Neutral: 3 puntos
En Desacuerdo: 2 puntos
Totalmente en Desacuerdo: 1 punto

Tabla: Escala de Valoracin del Alfa de Cronbach


Valor Alfa de Cronbach

Apreciacin

[0.95 a + >
[0.90 - 0.95>
[0.85 - 0.90>
[0.80 - 0.85>
[0.75 - 0.80>
[0.70 - 0.75>
[0.65 - 0.70>
[0.40 - 0.65>
[0.00 - 0.40>
Fuente: De Vellis (1991)

Muy elevada o Excelente


Elevada
Muy buena
Buena
Muy Respetable
Respetable
Mnimamente Aceptable
Moderada
Inaceptable

RESULTADOS DEL PROCESAMIENTO DE


CONFIABILIDAD
DEL
INSTRUMENTO
RECOLECCIN DE DATOS:

LA
DE

Estadsticos total-elem ento

Estadsticos de fiabilidad
Alf a de
Cronbach
.790

N de
elementos
10

Se alcanzo un Nivel de
Confiabilidad Muy
Respetable con un Alpha
= 0.79, siendo este test
consistente y adecuado
para el estudio

P1
P2
P3
P4
P5
P6
P7
P8
P9
P10

Media de la
escala si se
elimina el
elemento
35.3500
35.0000
34.9500
35.0000
35.0000
34.5500
35.0500
35.0500
34.9500
35.6500

Varianza de
la escala si
se elimina el
elemento
25.818
25.263
23.945
25.263
27.474
31.839
26.155
24.787
24.576
36.661

Correlacin
elemento-tot
al corregida
.637
.756
.829
.650
.595
.063
.677
.572
.623
-.363

Alfa de
Cronbach si
se eleimina
el elemento
.750
.738
.724
.747
.760
.806
.748
.756
.749
.879

Sin embargo se puede observar que si se elimina la pregunta 10, el


alfa de cronbach aumentara pero por decisin del autor se decidi
conservar la pregunta dado que era importante para el test.

Al comprobar la fiabilidad para los elementos con todos los datos


se obtiene lo siguiente:
Estadsticos total-el emento
Media de la
es cala si s e
elim ina el
elemento

Estadsticos de fiabilidad
Alf a de
Cronbach

Varianza de
la es c ala s i
s e elim ina el
elemento

Alf a de
C ronbach si
s e eleimina
el elem ent o

C orrelacin
elemento-t otal
c orregida

P1

31.6475

22.259

.549

.718

P2

31.3597

23.348

.520

.725

N de elem ent os

P3

31.4604

23.424

.535

.724

10

P4

31.7698

23.526

.513

.726

P5

31.5252

23.382

.439

.734

P6

31.5396

23.018

.464

.730

P7

31.7914

22.514

.544

.719

P8

31.8561

22.588

.423

.736

P9

31.8417

22.337

.490

.726

P10

32.4748

27.396

-. 055

.813

.756

Para la motivacin intrnseca:


Estadsticos total-el emento
Medi a de la
escal a si se
elimina el
elemento

Estadsticos de fiabi li dad


Alf a de
Cronbac h
.825

Var ianza de
la escala si
se eli mina el
elemento

Correlacin
elemento-total
cor regida

Alfa de
Cronbach si
se eleimi na
el elemento

P1

14.8921

7.256

.500

.829

N de element os

P2

14.6043

7.009

.710

.765

P3

14.7050

7.267

.673

.776

P4

15.0144

7.377

.633

.787

P5

14.7698

6.932

.614

.792

Para la motivacin extrnseca :


Estadsticos total-elemento

Estadsticos de fiabilidad
Alf a de
Cronbach

N de element os

.623

Media de la
escala si se
elim ina el
elemento

Varianza de
la escala si
se elim ina el
elemento

P6

13.0432

7.926

.338

.588

P7

13.2950

7.470

.456

.535

P8

13.3597

6.435

.548

.473

P9

13.3453

6.894

.499

.506

P10

13.9784

8.413

.120

.709

Estadsticos de la escala
Media
16.7554

Varianza

Desviacin tpica

N de elem entos

10.606

3.25675

Correlacin
elemento-t otal
corregida

Alf a de
Cronbach si
se eleimina
el elem ent o

En el caso de instrumentos con coeficientes de confiabilidad


moderados como en este caso (0.623), una manera de saber hasta
dnde los mismos pueden ser aceptables, consiste en comparar
la desviacin estndar de la distribucin de puntajes (Sy) con el
error estndar de medicin (EEM) (Carlos Ruiz Bolvar,), cuya
frmula es:

EEM = error estndar de medicin.


Sy = Desviacin estndar de la distribucin de puntajes totales.
rtt = Coeficiente de confiabilidad.
En estos casos se recurre al criterio del error estndar de
medicin para decidir sobre la aceptabilidad de un coeficiente de
confiabilidad moderado, se requiere que se cumpla la condicin
de que Sy > EEM.

Como se puede observar, en el caso

el EEM
(1.9045) no excede el valor de la Sy(3.257); es
decir, que se cumple la condicin de
aceptabilidad sealada anteriormente. (Sy >
EEM). En consecuencia, el instrumento puede
ser utilizado

VALIDEZ DEL INSTRUMENTO DE RECOLECCIN DE


DATOS:
- Segn Hernndez, la validez se refiere, al grado en que un
instrumento (cuestionario) realmente mide las variables que pretende
medir.
-Una pregunta es vlida si estimula informacin exacta y relevante.
-La seleccin y la redaccin influyen en la validez de la pregunta.
- Algunas preguntas que son vlidas para un grupo de personas,
pueden no serlo para otro grupo.
- Entre menos tenga que reflexionar el sujeto, ms vlida ser la
respuesta. La validez implica congruencia en la manera de plantear
las preguntas.
La validez puede ser :
De contenido
De criterio
De constructo

VALIDEZ DE CONTENIDO
Se refiere al grado en que el test presenta una muestra
adecuada de los contenidos a los que se refiere, sin
omisiones y sin desequilibrios de contenido.
La validez de contenido se utiliza principalmente con tests
de rendimiento, y especialmente con los tests educativos y
tests referidos al criterio. En este tipo de tests se trata de
comprobar los conocimientos respecto a una materia o un
curso.
La validez de contenido descansa generalmente en el
juicio de expertos (mtodos de juicio). Se define como el
grado en que los tems que componen el test representan
el contenido que el test trata de evaluar.

Para este anlisis se ha utilizado el programa Excel


Versin 2007,y se aplic
la tcnica estadstica
denominada Coeficiente de Proporcin de Rangos (CPR)
basado en el mtodo a juicio de expertos, que consiste
en un examen sistemtico de cada de uno de los tems preguntas del mismo, para determinar si miden las
variables que se espera medir, la pertinencia del
contenido, la claridad de los enunciados de cada uno de
ellos, y el nivel de concordancia entre los evaluadores.
Se sigui el siguiente procedimiento:
Se solicit la colaboracin de tres expertos de la carrera
de psicologa, con el objeto de determinar la pertinencia
de contenido de los tems del instrumento. Se les entreg
el cuestionario y la informacin necesaria y se obtuvo la
evaluacin del cuestionario de cada uno de los expertos.

TESIS: RELACIN ENTRE LA MOTIVACIN Y EL RENDIMIENTO


ACADMICO DEL CURSO DE ESTADSTICA EN ESTUDIANTES
DEL CUARTO CICLO DE LA FACULTAD DE DERECHO DE LA
UNIVERSIDAD CSAR VALLEJO EN EL SEMESTRE 2008-II
OBJETIVOS DE LA INVESTIGACION:
Objetivo General:
Determinar el nivel de relacin existente entre la motivacin de
los estudiantes de la facultad de derecho de la UCV y el
rendimiento acadmico del curso de estadstica.
Objetivos especficos:
Determinar el nivel de relacin existente entre la motivacin
intrnseca del alumno y el rendimiento acadmico en estadstica.
Determinar el nivel de relacin existente entre la motivacin
extrnseca
del alumno y
el rendimiento acadmico en
estadstica.

ANEXO B: VALIDACION DEL CUESTIONARIO


FORMATO PARA EVALUACIN DEL CUESTIONARIO
Datos del Evaluador:
Apellidos y Nombres: .
Nmero de Colegiatura:..
Profesin:.
Lugar de Trabajo:.
Cargo que desempea:
rea:
tems-

Objetivos

Escala Evaluativa

Preguntas

Especficos

1,2,3,4 y 5

6,7,8,9 y 10

Observaciones
C

ESCALA EVALUATIVA DE CORRESPONDENCIA ITEMS- OBJETIVOS:


A: TOTALMENTE DE ACUERDO
B: DE ACUERDO
C: DESACUERDO

La informacin proporcionada por cada uno de los expertos se


proces y analiz calculando el coeficiente de proporcin de
rango corregido.
TABLA B1: TABULACIN DE LOS DATOS RESPECTO A LA EVALUACIN
DEL INSTRUMENTO

ITEM

EVALUADORES

PREGUNTAS
1

1, 2, 3, 4, 5

II

6, 7, 8, 9, 10

Fuente: Clculos Propios

Puntaje escala Evaluativo de los tems:


A: Totalmente De Acuerdo : 3 puntos
B: De Acuerdo : 2 puntos
C: Desacuerdo: 1 punto
TABLA B2:
TABULACION SEGN ESCALA EVALUATIVA DE LOS ITEMS
ITEM
I

EVALUADORES

PREGUNTAS
1, 2, 3, 4, 5

II
6, 7, 8, 9, 10
Fuente: Clculos Propios

Segn los especialistas, existe una muy alta validez y


concordancia de los mismos, esto se evidencia al calcular el
Coeficiente de Proporcin de Rango que alcanz un 87 %.

EVALUADORES
ITEM PREGUNTAS
I
1, 2, 3, 4, 5
II 6, 7, 8, 9, 10
TOTALES

1
3
3
6

Promedio de Rangos
Pr i
para cada tem

2
3
2
5

3
3
3
6

Proporcion
Promedio
de Rangos
S ri
9
8
0 17

ri
3
2.667
5.667

Pe

de cada item
1.00
0.89
1.89

0.037
0.037
0.074

ri
j

Proporcin de Rangos para cada tem i: Es el


promedio de rangos de cada tems individuo
P Pr i
dividido entre el puntaje mximo de la escala
evaluativo de los tems (coeficiente de validez de
cada tem)
Correccin:
J: Nmero de jueces : 3

Pr i
( k )
1
Pe
j

K= Numero
de rangos
de la escala
evaluativa

Coeficiente de Proporcin de Rangos:


P Pr i
CPR
N

1.89
CPR
2

CPR : 0.944

N= Numero de tems

Coeficiente de Proporcin de Rangos


Corregido :
INTERPRETACION

CPRc:

CPR - Pe

CPRc:

0.944-0.074

CPRc:

0.870

Muy Alta

Mayor que

Menor igual que

0
0.4
0.6
0.8

0.4
0.6
0.8
1

Validez y concordancia
Baja
Moderada
Alta
Muy Alta

VALIDEZ DE CONSTRUCTO
Se refiere al grado en que el instrumento de medida cumple
con las hiptesis que cabra esperar para un instrumento de
medida diseado para medir precisamente aquello que
deseaba medir. Se puede considerar un concepto general
que abarcara los otros tipos de validez.
El trmino constructo hace referencia a un concepto
terico psicolgico inobservable (ej. la inteligencia, cada
factor de personalidad, las aptitudes, las actitudes, etc.)
La definicin operativa de estos constructos presenta
considerables dificultades en la prctica, ya que no son
directamente observables. Debido a esto, la validacin de
un constructo es un proceso laborioso y difcil.

TECNICAS CORRELACIONALES
En resumen, las tcnicas correlacionales o de la o
consistencia interna relativa empleados en la validez
de constructo son procedimientos de correlacin
entre:
Item Test
Item Escala (Subtests)
Escala Test o Test Subtests
ESCALA DE VALORACIN PARA INTERPRETAR LA CORRELACIN EN LA VALIDACIN

ri.t

Nivel de discriminacin

0.40 a ms
0.30 0.39
0.20 0.29
0 0.19
Fuente: Elosua Oliden y Bully Garay ( 2012), Pg. 58.

Muy bueno
Bueno
Deficiente
Insuficiente

ANLISIS FACTORIAL
El anlisis factorial nos indica cmo tienden a
agruparse los tems o variables. Examinando el
contenido conceptual de los tems que pertenecen al
mismo factor podemos comprender qu factores [o
constructos] subyacentes explican las correlaciones
entre los tems. El anlisis factorial de un
instrumento de medicin ayuda a establecer la
validez de constructo de lo que estamos midiendo,
en el sentido de que nos analiza la estructura del
constructo que estamos pretendiendo medir.

EL ANLISIS DE COMPONENTES PRINCIPALES


Segn Johnson(2000),
el ACP comprende un
procedimiento matemtico que transforma un conjunto de
variables correlacionadas de respuesta en un conjunto
menor de variables no correlacionadas llamadas
componentes principales . Tambin menciona que la
mayora de libros sobre Mtodos Multivariados sugieren
que los objetivos principales de un ACP son :
1) Reducir la dimensionalidad de un conjunto de datos,
2) Identificar nuevas variables significativas subyacentes
Uriel, E. y Aldas (2005) plantean que el mtodo de
Componentes Principales tiene por objeto transformar
un conjunto de variables , a las que denominan
variables originales , en un nuevo conjunto de variables
denominadas componentes principales. Estas ltimas
se caracterizan por estar intercorrelacionadas entre s.
Agregan que como medida de la cantidad de
informacin incorporada en una componente se utiliza
su varianza.

PROCEDIMIENTO PARA HALLAR LOS


COMPONENTES PRINCIPALES
1.- Analizar si los datos cumplen con las condiciones
mnimas para la aplicacin de la prueba (Prueba KMO y
de Esfericidad de Bartlett)
2.- Hallar comunalidades, es decir , la proporcin de la
varianza del indicador que es explicada por los
componentes o factores comunes.
3.- Obtencin de los componentes principales.
4. Seleccin del Nmero de Componentes
5. Interpretacin de los Componentes
6.Aplicacin de los resultados al anlisis

Para realizar esta prueba es necesario analizar si los datos


cumplen las condiciones mnimas para la aplicacin de la
tcnica:

Podemos comprobar que se presenta una buena adecuacin


muestral a los datos, ya que el estadstico de Keiser-Meyer-Olkin
(KMO), que nos indica la proporcin de la varianza que tienen en
comn las variables analizadas, presenta un valor de 0,802,
coeficiente cercano a la unidad que es lo ms aconsejado para
este tipo de anlisis, y la prueba de esfericidad de Bartlett que
comprueba las variables estn correlacionadas. Esto nos indicara
una buena adecuacin de los datos a un modelo de anlisis
factorial.
KMO y prueba de Bartlett
Medida de adecuacin muestral de
Kaiser-Meyer-Olkin.
Prueba de esfericidad
de Bartlett

Chi-cuadrado
aproximado
gl
Sig.

.802
438.374
45
.000

TABLA :VARIANZA TOTAL EXPLICADA

Fuente: Clculos Propios

EN EL GRFICO SE
PUEDE OBSERVAR
QUE EXISTEN 2
COMPONENTES CON
AUTOVALORES
SUPERIORES A 1

. Al llevar a cabo la rotacin de factores, encontramos que


los dos componentes con autovalores mayores a uno
explicaron el 55.01 % de la varianza total
TABLA MATRIZ DE COMPONENTES ROTADOS
Componente
PREGUNTAS
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10

DIMENSIN
1
1
1
1
1
2
2
2
2
2

1
0.52
0.80
0.78
0.76
0.79
0.39
0.28
0.02
0.13
0.44

2
0.47
0.13
0.19
0.16
0.07
0.47
0.69
0.81
0.72
0.42

Fuente: Clculos Propios

Las rotaciones son transformaciones lineales que facilitan la interpretacin sin alterar
la proporcin de varianza explicada por los factores

VALIDEZ DE CRITERIO
Se establece al validar un instrumento de medicin al

compararlo con algn criterio externo que pretende medir


lo mismo.
Si el criterio se fija en el presente de manera paralela se
habla de validez concurrente (los resultados se
correlacionan con el criterio en el mismo momento o punto
de tiempo).
Si el criterio se fija en el futuro se habla de validez
predictiva( ejem: una prueba para determinar la capacidad
gerencial de candidatos a ocupar puestos ejecutivos se
validara comparando los resultados con el desempeo
posterior de los ejecutivos)

Escala de valoracin del coeficiente de correlacin de Pearson


Valor de r
Grado de correlacin
-1.00
Correlacin negativa Perfecta
-0.90
Correlacin negativa Muy fuerte
-0.75
Correlacin Negativa Considerable
-0.50
Correlacin Negativa Media
-0.25
Correlacin Negativa dbil
0.00
No existe correlacin alguna entre las variables
+0.10
Correlacin Positiva Muy Dbil
+0.25
Correlacin Positiva Dbil
+0.5
Correlacin Positiva Media
+0.75
Correlacin Positiva Considerable
+0.90
Correlacin positiva Muy fuerte
+1.00
Correlacin positiva Perfecta
Hernndez, Fernndez y Baptista ( 2010)

Factores que pueden afectar la confiabilidad y la


Validez
La improvisacin. Algunas personas creen que elegir un
instrumento de medicin o desarrollar uno es algo fcil y que no
requiere de supervisin alguna.
La traduccin, an cuando adaptemos los trminos a nuestro
lenguaje no es ni remotamente validarlo.
La inadecuacin o falta de empata. Hay instrumentos que tienen
un lenguaje muy elevado para el entrevistado o no toma en cuenta
diferencias de sexo, edad, nivel ocupacional y educativo.
Las condiciones de aplicacin. El ruido, presionar para que una
persona conteste un instrumento largo en un perodo de tiempo
corto, el hambre o falta de motivacin para responder influir
negativamente en la validez y confiabilidad de la medida.
Los aspectos mecnicos. Que el instrumento tenga instrucciones
precisas, que se lea bien (si se trata de un cuestionario escrito), que
no le falten pginas, que haya un espacio adecuado para contestar.

Potrebbero piacerti anche