Sei sulla pagina 1di 28

SESION 8

DIRECCIÓN ACADÉMICA DE
INVESTIGACIÓN

VALIDEZ Y CONFIABILIDAD
DE LOS INSTRUMENTOS
SESIÓN 8
SEGUNDA UNIDAD
Método científico: Marco metodológico

CAPACIDADES TEMÁTICA

Técnicas e instrumentos de recolección


de datos. Validación y confiabilidad.
Formula el diseño
Aplicación de los instrumentos de
metodológico
recolección de datos Métodos de análisis
de datos
CONCEPTO DE MEDICIÓN
El ser humano siempre a tenido la inquietud de saber la medida de
algo. por ejemplo de un edificio, de un objeto, de personas entre
otros. Medir siempre ha sido una necesidad del ser humano y la
investigación científica no esta ajena a estos parámetros de
medición, tanto en las ciencias sociales como en la ciencias naturales.

Medición consiste en hacer una comparación de un valor o una


magnitud frente a un patrón de medida. Según Carmines y Zeller,
(1991). puede definir a la medición como “el proceso de vincular
conceptos abstractos con indicadores empíricos”, el cual se realiza
mediante un plan explícito y organizado para clasificar (y con
frecuencia cuantificar) los datos disponibles (los indicadores), en
términos del concepto que el investigador tiene en mente
Los instrumentos deben ser:
Kerlinger (1979)

CONFIABLE Ó FIABLE VALIDO

Grado de aplicación repetida al Grado en que un instrumento


mismo sujeto produce iguales realmente mide la variable que se
resultados pretenda medir
Validez de Contenido

Validez total Validez de Criterio

Validez de Constructo
Validez de Contenido
Grado en que un instrumento refleja un dominio específico de contenido de
lo que se mide.

Ejemplo:
Una prueba de operaciones aritméticas no es válida si solo incluye la
suma y la resta y excluye la multiplicación y la división.

Según plantea (De Arquer, M. I. 2011) se debe considerar que la validez de


contenido cualitativamente es una cuestión de juicio, se estima de manera
subjetiva o intersubjetiva empleando, usualmente, el denominado Juicio
de Expertos.
La validez cualitativa por juicio de experto y cuantitativa con la Técnica
Aiken o Prueba binomial
Validez de Contenido
Dominio de Variable

MATEMÁTI C A

Instrumento con Instrumento sin


validez de validez de
contenido contenido
M Á
A T
I
T C M A T E
E A
M
Item
Expertos Total
EXP1 EXP2 EXP3 EXP4 EXP5 S V
1
2
1
1
1
1
1
0
0
1
1
1
4
4
0.8
0.8
Coeficiente V de Aiken
3 1 0 1 1 1 4 0.8
4 1 1 1 1 1 5 1
5 1 1 1 0 1 4 0.8
6 1 1 0 1 1 4 0.8
7 1 1 1 0 1 4 0.8
8 1 1 1 1 1 5 1
9 1 1 1 1 1 5 1
10 1 1 1 1 0 4 0.8
11 1 1 1 1 1 5 1
12 1 1 1 1 1 5 1
13 0 1 1 1 1 4 0.8
14 1 1 1 1 1 5 1
15 1 0 1 1 1 4 0.8
16 0 1 1 1 1 4 0.8
17 1 1 1 1 0 4 0.8
18 1 0 1 1 1 4 0.8
19 1 0 1 1 1 4 0.8
20 1 1 0 1 1 4 0.8
21 1 1 1 1 1 5 1
22 1 1 1 1 1 5 1
23 1 1 0 1 1 4 0.8
24 1 1 1 1 1 5 1
25 1 1 0 1 1 4 0.8
26 1 1 1 1 1 5 1
27 1 1 1 1 1 5 1
28 1 1 1 1 0 4 0.8
29 0 1 1 1 1 4 0.8
30 1 1 1 1 1 5 1
31 1 1 1 0 1 4 0.8
Promedio
0.877
de validez
Prueba binomial con SPSS

Proporción Prop. de Sig. exacta


Categoría N observada prueba (bilateral)
Juez1 Grupo 1 Si 28 .90 .50 .000
Grupo 2 No 3 .10
Total 31 1.00
Juez2 Grupo 1 Si 27 .87 .50 .000
Grupo 2 No 4 .13
Total 31 1.00
Juez3 Grupo 1 Si 26 .84 .50 .000
Grupo 2 No 5 .16
Total 31 1.00 P promedio = 0.000
Juez4 Grupo 1 No 4 .13 .50 .000 P promedio < 0.05,
Grupo 2 Si 27 .87
Total 31 1.00 La Prueba Binomial indica que el
Juez5 Grupo 1 Si 28 .90 .50 .000 instrumento de observación es valido
Grupo 2 No 3 .10
Total 31 1.00
Validez de Constructo
Según Hernández, Fernández y Baptista, (2014, p. 203)Debe explicar cómo las mediciones
del concepto o variable se vinculan de manera congruente con las mediciones de otros
conceptos correlacionados teóricamente.]..…[El proceso de validación de un constructo
está vinculado con la teoría. No es conveniente llevar a cabo tal validación, a menos que
exista un marco teórico que soporte la variable en relación con otras variables.

En otras palabras, se refiere al grado en que una medición de una variable se relacione
consistentemente con otras mediciones de variables, acuerdo con hipótesis derivadas
teóricamente y que conciernen a los conceptos que están siendo medidos.
Validez de Constructo
Un constructo es una variable medida y que tiene lugar dentro de una teoría o esquema
teórico. La validez de constructo incluye tres etapas (Carmines y Zeller, 1991):

1. Sobre la base de la revisión de la literatura, se establece y especifica la relación entre


el concepto o variable medida por el instrumento y los demás conceptos incluidos en la
teoría, modelo teórico o hipótesis.

2. Se asocian estadísticamente los conceptos y se analizan cuidadosamente las


correlaciones.
3. Se interpreta la evidencia empírica de acuerdo con el nivel en el que se clarifica la
validez de constructo de una medición en particular.

Para efectuar la validez de constructo podemos emplear: análisis factorial, análisis de


cofactores, análisis de covarianza. Además la correlación por rangos (Rho) de Spearman, la
correlación por puntuaciones netas r de Pearson y el coeficiente Alfa de Cronbach.
Validez de Constructo ejemplo
La validez de constructo mediante
correlación dimensiones total con el
coeficiente correlación de Pearson en SPSS la
secuencia a seguir es: analizar,

Aprendizaje de Lenguaje Lenguaje Lenguaje Lenguaje


regresión lineal verbal algebraico numérico gráfico
Aprendizaje de Correlación de Pearson 1 ,942** ,929** ,940** ,812**
regresión lineal Sig. (bilateral) ,000 ,000 ,000 ,000
N 15 15 15 15 15
Lenguaje verbal Correlación de Pearson ,942** 1 ,868** ,993** ,635*
Sig. (bilateral) ,000 ,000 ,000 ,011
N 15 15 15 15 15
** ** **
Lenguaje Correlación de Pearson ,929 ,868 1 ,881 ,697**
algebraico Sig. (bilateral) ,000 ,000 ,000 ,004
N 15 15 15 15 15

Se observa que la correlación entre la variable Lenguaje Correlación de Pearson ,940** ,993** ,881** 1 ,599*
numérico Sig. (bilateral) ,000 ,000 ,000 ,018
aprendizaje de regresión lineal y sus dimensiones N 15 15 15 15 15
nivel de lenguaje verbal, nivel de lenguaje Lenguaje Correlación de Pearson ,812** ,635* ,697** ,599* 1
algebraico, nivel de lenguaje numérico y nivel de gráfico Sig. (bilateral) ,000 ,011 ,004 ,018

lenguaje gráfico es superior a 0,80, indica que el N 15 15 15 15 15


**. La correlación es significativa en el nivel 0,01 (bilateral).
constructo del instrumento es alta *. La correlación es significativa en el nivel 0,05 (bilateral).
Validez de Criterio
establece la validez de un instrumento de medición comparándola con algún
criterio externo.
Este criterio es estándar con el que se juzga la validez del instrumento .
Entre los resultados del instrumento de la medición se relaciona más al criterio, la
validez del criterio será mayor.

Según Hernández, et al (2014), la validez de criterio de un instrumento de medición


se establece al comparar sus resultados con los de algún criterio externo que
pretende medir lo mismo.

Si el criterio se fija:
validez concurrente (presente) validez predictiva (futuro)
Validez de Criterio

Se puede aplicar el Coeficiente de Contingencias, Spearman – Brow, Pearson, Alfa


de Cronbach, para determinar la validez de criterio

𝑛 𝑋𝑌 − 𝑋 𝑌
𝑟𝑥𝑦 =
𝑛 𝑋2 − 𝑋 2 𝑛 𝑌2 − 𝑌 2

Donde:
Validez de Criterio SPSS ejemplo
La confiabilidad
La confiabilidad se refiere al grado de estabilidad que al medir presenta un
determinado instrumento. Esto en el sentido de que si aplicamos
repetidamente un instrumento al mismo sujeto u objeto en iguales
condiciones y en tiempos próximos debe producir iguales resultados. Una
balanza o un termómetro serán confiables si al pesar o al medir en dos
ocasiones seguidas, se obtienen los mismos resultados.

Según Hernández, et al (2014, p. 200), La confiabilidad


de un instrumento de medición se refiere al grado en
que su aplicación repetida al mismo individuo u objeto
produce resultados iguales.
Tipos de confiabilidad
1.- Medida de Estabilidad
También llamada confiabilidad test - retest. Un mismo instrumento es aplicado
dos o más veces a un mismo grupo de personas en condiciones similares. Si la
correlación entre los resultados de las diferentes aplicaciones es altamente
positiva, el instrumento se considera confiable.

𝑛 𝑋𝑌 − 𝑋 𝑌
𝑟𝑥𝑦 =
𝑛 𝑋2 − 𝑋 2 𝑛 𝑌2 − 𝑌 2

nde:
2) Método de formas alternativas o paralelas.
En este esquema no se administra el mismo instrumento de medición, sino
dos o más versiones equivalentes de éste. Las versiones (casi siempre dos)
son similares en contenido, instrucciones, duración y otras características, y
se administran a un mismo grupo de personas simultáneamente o dentro de
un periodo corto. El instrumento es confiable si la correlación entre los
resultados de ambas administraciones es positiva de manera significativa
(Rodríguez, 2006b). Citado por Hernández, et al (2014, p. 294),

a) Coeficiente de Pearson:
𝑛 𝑋𝑌 − 𝑋 𝑌
𝑟𝑥𝑦 =
𝑛 𝑋2 − 𝑋 2 𝑛 𝑌2 − 𝑌 2
3) Método de mitades partidas (Split-halves).
El método de mitades partidas necesita sólo una aplicación de la medición.
Específicamente el conjunto total de ítems o reactivos se divide en dos
mitades equivalentes y se comparan las puntuaciones o los resultados de
ambas. Si el instrumento es confiable, las puntuaciones de las mitades
deben estar correlacionadas. En este caso se pueden utilizar:

pearman- Brown:
a) Coeficiente de Spearman- Brown:
b) Coeficiente de Guttman

2 ∙ 𝑟𝐸𝑀 𝑆𝑎2 + 𝑆𝑏2


𝑟𝑑𝑚 = 2 ∙ 𝑟𝐸𝑀 𝑟𝑡𝑡 = 2 1 − 𝑆𝑡2
1 + 𝑟𝐸𝑀 𝑟𝑑𝑚 =
1 + 𝑟𝐸𝑀
4) Medidas de coherencia o consistencia interna.
Miden la homogeneidad de los ítems. Requiere una sola administración del instrumento
de medición. No necesita dividir los ítems del instrumento. Se aplica la medición y se
calcula el coeficiente de confiabilidad, Hernández, et al (2014).
a) Alfa de Cronbach. Se usa cuando los ítems tienen alternativas policotómicas como
las escalas Likert; la cual puede tomar valores entre 0 y 1, donde 0 significa
confiablidad nula y 1 representa confiabilidad total, el coeficiente 𝛼 de Cronbach
se puede calcular con la siguiente fórmula:
ÍTEMS PUNTUACIÓN
ALUMNO
1 2 3 4 5 6 7 8 9 10 TOTAL Si2 = varianza de las puntuaciones
CESAR 5 1 2 3 4 5 1 2 3 4 30
EDUARDO 4 4 4 4 4 4 4 4 4 4 40 en cada ítem por todos los
MARÍA 5 5 5 4 5 4 4 4 4 4 44 examinados.
ANA 3 3 3 3 3 3 3 3 3 4 31 St2 = varianza total de las
SOFÍA 2 2 2 2 2 2 2 2 2 2 20
RITA 5 1 2 3 4 5 1 2 3 4 30 puntuaciones de filas de todos los
Varianza examinados.
TOTAL
24 16 18 19 22 23 15 17 19 22 Total 71.9
K = número de ítems
PROMEDIO 4.00 2.67 3.00 3.17 3.67 3.83 2.50 2.83 3.17 3.67
VARIANZA S_suma
2 3 2 1 1 1 2 1 1 1 13
INDIVIDUAL Var. Ind

Varianza
muestral = Varianza El coeficiente Alfa de Cronbach
k=Número de 0,91 indica que el instrumento
10
ítems tiene alta confiabilidad o
Alfa de Cronbach excelente confiabilidad
Alfa de Cronbach 0.9107
omo cri erio e er l, eor e ller , p. s iere l s
recome cio es si ie es p r e l r los coe icie es e l e
ro c

oe icie e l . es e cele e

oe icie e l . es e o

oe icie e l . es cep le

oe icie e l . es c es io le

oe icie e l . es po re

oe icie e l . es i cep le
Resumen de procesamiento de casos

N %
Casos Válido 12 100,0
Excluidoa 0 ,0
Total 12 100,0
a. La eliminación por lista se basa en todas las variables
del procedimiento.

Estadísticas de fiabilidad

Alfa de Cronbach N de elementos


,882 20
Confiabilidad con KR_20 de Kuder-Richardosn
Correlación a través de proporciones de aciertos y desaciertos y varianza del total de aciertos.
Aplicable en lista de cotejo, cuestionarios de preguntas cerradas con opciones dicotómicas (V-F),
(si-no), (correcto-incorrecto), (malo-bueno). Codificados con 1-0

ITEMS
Número de ítems: n= 20
N° IT1 IT2 IT3 IT4 IT5 IT6 IT7 IT8 IT9 IT10 IT11 IT12 IT13 IT14 IT15 IT16 IT17 IT18 IT19 IT20
1 1 1 0 0 1 1 0 1 0 0 1 0 1 1 0 1 0 1 0 1 11
2 1 0 1 1 0 0 1 1 1 1 0 1 1 0 1 0 1 1 0 1 13
3 0 0 1 1 1 1 0 1 1 0 1 1 1 1 0 1 0 1 0 0 12
4 1 1 1 0 1 0 1 0 1 1 1 0 1 1 1 0 1 1 1 1 15
5 1 0 0 1 1 1 0 1 0 1 1 1 0 0 1 1 1 1 1 1 14
6 1 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 17
7 0 1 1 1 1 0 1 1 1 1 1 1 1 0 0 1 1 0 1 1 15
8 1 0 1 1 1 1 1 1 1 0 1 1 0 1 1 0 0 1 1 1 15
9 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 3
10 1 0 1 0 1 0 1 0 1 0 0 1 0 0 1 0 0 0 0 0 7

P 0.8 0.4 0.7 0.6 0.8 0.5 0.7 0.7 0.7 0.5 0.7 0.7 0.5 0.4 0.6 0.5 0.5 0.7 0.5 0.7 Vt 18.18 El coeficiente KR20 = 0,79
indica que el instrumento tiene
q=(1-p) 0.2 0.6 0.3 0.4 0.2 0.5 0.3 0.3 0.3 0.5 0.3 0.3 0.5 0.6 0.4 0.5 0.5 0.3 0.5 0.3 buena confiabilidad o
Pq 0.16 0.24 0.21 0.24 0.16 0.25 0.21 0.21 0.21 0.25 0.21 0.21 0.25 0.24 0.24 0.25 0.25 0.21 0.25 0.21 4.46 excelente confiabilidad
Referencias
Alvarado, E., Canales, F. y Fineda, E. (1994). Metodología de la Investigación (2ª ed.). Washington D. C: Organización
Panamericana de la Salud
Bostwick, G.J. y Kyte, N.S. (2005). Measurement. En Grinell, R.M. y Unrau, Y.A. (Eds.). Social work: Research and
evaluation. Quantitative and qualitative approaches (7ª ed., pp.97-111). Nueva York: Oxford University Press
Carmines, N. y Zeller, R. (1979) Reliability and validity assessment. Londres: Sage. Cronbach, L. (1951) “Coefficient
alpha and the internal structure of test”. Psychometrika, 16, 3, 297-334.
De Arquer, M. I. (2011). NTP 401: Fiabilidad humana: métodos de cuantificación, juicio de expertos. Centro nacional de
condiciones de trabajo, España.
Hernández, S., Fernández, C., & Baptista, L. (2014). Metodología de la Investigación. 6ta edición (5ta ed.). México:
McGraw-Hill/Interamericana.

Potrebbero piacerti anche