Sei sulla pagina 1di 48

Pontificia Universidad Católica de Chile

Facultad de Matemáticas
Departamento de Estadística

COMPARACIÓN DE MÉTODOS DE
- .....
MEDICION CON UN GOLD-STANDARD

Natalia Elizabeth Venegas Cancino

Tesis presentada a la Dirección de Investigación y Postgrado


como parte de los requisitos para optar al grado de
Magíster en Estadística

Profesor Supervisor:
MANUEL GALEA ROJAS

Financiada por:
CONICYT

Santiago de Chile, Diciembre 2011


@ MMXI NATALIA ELIZABETH VENEGAS CANCINO
~

Indice general

Resumen 4

l. INTRODUCCIÓN 5

1.1. Motivación . . 5
1.2. Coeficiente de correlación intraclase 7

2. MODELO GOLD STANDARD 9

2.1. Estimación por máxima verosimilitud 11


2.1.1. Función Score . .. . . . .. 11

2.1.2. Matriz de información observada 11


2.1.3. Matriz de información esperada 12
2.1.4. EMV de f-l, cPx y ~ 12
2.1.5. EMV de p 13
2.2. Distribución muestral de los EMV . 15
2.2.1. Intervalo de confianza para el coeficiente de correlación intraclase 16

3. COMPARACIÓN DE p MÉTODOS APROXIMADOS EN PRESENCIA DEL GOLD-


STANDARD 17
3.1. Test de razón de verosimilitud (TRV) 18
3.1.1. Solución iterativa para encontrar los EMV 20
3.1.2. Planteamiento del test . . . . . . . . . . 22
3.2. Test de Wald , Score de Rao y C(a) de Neyman 24
3.2.1. Estadísticos de los test . . 25

2
4. Aplicaciones 26
4.1. Datos simulados I . 26
4.2. Datos simulados II 28
4.3. Datos Reales I: Nivel de Colesterol (Bangdiwala y Muñoz 1979) 30
4.4. Datos Reales II: Exámenes matemáticos (Mardia, Kent and Bibby 1970) 31

Apéndice 34
a. Densidad Zi 34
a.1. Inversa de la matriz de covarianza 34
a.2. Descomposición de ói 35
a.3. Función Score . 36
b. Test asintóticos . . . . 37
b.1. Test de razón de verosimilitud 37
b.2. Test de Wald, Score de Rao y C(a) de Neyman 38
c. Newton Raphson .. . . . . . . . .. .. .. . .. .. . 41
c.l. Método Iterativo de Newton Raphson para EMV 43
c.2. Primera derivada con respecto a '1/Jij 44
c.3. Segundas derivadas . . . . . . . . . . 45

Anexo 46
i. Datos Mardia, Kent and Bibby 1970 46
ii. Datos Bangdiwala y Muñoz 1979 47

Referencias 48

3
Resumen

Es cada vez más frecuente la necesidad de comparar el grado de acuerdo de p


métodos aproximados con respecto al método de medición sin error (gold-standard). Para
cuantificar esta concordancia se cuenta con el coeficiente de correlación intraclase para el
j-ésimo método alternativo, pj con j = 1, ... ,p. Luego, para estudiar si los p métodos
de medición tienen igual grado de acuerdo con el gold-standard se plantea la hipótesis
H 0 : p1 = · · · = PP que puede ser probada por test de razón de verosimilitud, test de Wald,
test Score de Rao y test C(a) de Neyman.

4
Capítulo 1

INTRODUCCIÓN

l. l. Motivación

Hoy en día es muy solicitado simplificar los instrumentos de medición sin perder la precisión
en la variable de interés. En muchas ocaciones es necesario un método más portátil o menos
engorroso para obtener un resultado, pero se requiere con la misma exacitud que con la que
se trabaja habitualmente. Por ejemplo, existe la prueba de ADN que se puede realizar en
casa, la inquietud obvia es qué tan "buena" es esta prueba en comparación con la realizada
en un laboratorio certificado. O se puede cuestionar la calidad de un examen de sangre
realizado en un hospital rural con el obtenido en un laboratorio internacional, incluso se
podría querer comparar con varios examinadores más. En algunos casos se puede contar
con un intrumento o método utilizable como regla de oro (gold-standar) , la cual se asume
es medida sin error y permite calcular las diferencias de los otros métodos.

Para este proyecto contamos con un conjunto de datos reales de un estudio cuyo objetivo
fue evaluar tres analizadores químicos portátiles en la medición del colesterol (Bangdiwala
& Muñoz 1979) . Estos instrumentos usan, como método de cuantificación de los niveles de
colesterol, un fotómetro de reflejo. Los analizadores comparados fueron: Ektachem (DT60
Kodak©), Chol estech© (LDX) y Reflotron© (Boehringer-Mannheim) con respecto a
uno no portátil que cumple las normas de estandarización de los Centros de Control de
Enfermedades como gold-standard (Laboratorio).

5
Se obtuvieron muestras de sangre de 47 voluntarios sanos para ser evaluados por los
diferentes instrumentos. Estas muestras de sangre se obtuvieron a través de un punzón
en el dedo para cada uno de los instrumentos portátiles y de una muestra de sangre por
jeringa para ser evaluada por el laboratorio. Todas las muestras de un mismo paciente
fueron obtenidas simultáneamente.

Para apreciar visualmente la relación del gold-standard con cada uno de los métodos
alternativos, se realiza los gráficos de dispersión con la recta de 45° trazada.

Figura 1: Gráfico de dispersión del nivel de colesterol medido por el laboratorio vs.
analizadores portátiles.

Analizador Ektachem vs. Laboratorio Analizador Cholestech vs. Laboratorio


.!::.
E o o o
~ o 2fJ) o
.!::.
o '"" ~ '""
19 o.!::.
""'UJ o ü o
o
"O
o
N o o
N
ro "O
.!:::! ro
roe .!:::!
o roe o
<( o <(
o

100 150 200 250 300 100 150 200 250 300

Laboratorio Laboratorio

Analizador Reflotron vs. Laboratorio

100 150 200 250 300


Laboratorio

Se puede observar que los resultados obtenidos por los métodos portátiles son similares a
los obtenidos por el laboratorio. Lo que se quiere averiguar es que si estos instrumentos
son igual de concordantes con respecto al laboratorio.

6
1.2. Coeficiente de correlación intraclase

El coeficiente de correlación intraclase, p, puede ser usado como medida de concordancia


entre el método aproximado y el gold-standard. Al usar p, se evalúa el acuerdo relativo
a la variabilidad del gold-standard, <Px· Si se fija la variabilidad extra que posee el
método alternativo, ();, el coeficiente de correlaición intraclase aumenta con respecto a
·<Px· Cualquier idea sobre la existencia de acuerdo requiere especificar cuánto es un límite
superior aceptable para () 2 , independiente del valor de <jJ x ó p, para poder concluir que el
método alternativo y el gold-standard no son suficientemente concordantes.

El coeficiente de correlación intraclase tiene múltiples aplicaciones en investigaciones de


todo tipo. Por ejemplo, en teoría de confiabilidad, cuando los datos son recolectados por
varios conjuntos de observadores, especialmente en psicología. En análisis de sensibilidad,
para estudiar la efectibidad de un tratamiento experimental. En genética, juega un rol
central en estimar la heredabilidad de ciertas características en animales y plantas. En
epidemiología, para medir el grado de semejanza entre especies según las características
ambientales y biológicas.

Sin embargo, más allá de su utilidad como estadístico descriptivo, se ha hecho necesario
realizar inferencias apartir de éL Por ejemplo, testear si es igual a algún valor específico
p0 , estimar su intervalo de confianza, probar si para varios métodos se obtiene el mismo

grado de concordancia, etc.

Planteamiento de Fisher

El primer planteamiento del coeficiente de correlación intraclase fue realizado por Ronald
A. Fisher (1925) en el Capítulo "VII. Intraclass Correlations and the Analysis of Variance"
de su libro "Statistical Methods for Research Workers".

7
La comparación de dos métodos sobre un mismo estudio ilustra el principio
de este coeficiente, ya que, si ambos son medidos con precisión, las pruebas
estadísticas están obligadas a coincidir, pudiéndose aplicar reducciones de un
método sobre el otro.

Para calcularlo se cuenta con los n pares de datos,

[x, x'] = [(x1, x~), ... , (xn, x~)]

Entonces se calcula la media, x, y varianza común, 52

Para posteriormente obtener


1 n
p = 52 :L)xí- x)(x~- x)
n í=l

En el caso de comparación de p métodos, se plantea un modelo a partir del cual se obtiene


la expresión de Pj a estimar.

8
Capítulo 2

MODELO GOLD STANDARD

Uno de los usos del coeficiente de correlación intraclase es cuando se posee mediciones
de un método alternativo que aproxima las medidas obtenidas por un instrumento gold-
standard y se desea evaluar su grado de acuerdo con ésta. Esta problemática difiere de
otros tipos de estudios de comparación como la calibración y la conversión, ya que se
asume que el nuevo método está medido en la misma escala y la medida gold-standar está
presente.

Un modelo estándar para estudiar el grado de acuerdo entre dos o más métodos
aproximados es el modelo de un efecto aleatorio

donde E:ij es el error de medición sobre la i-ésima unidad por el j-ésimo método
aproximado y se considera que E(xi) = ¡_¿, E(E:ij) = O y Var(xi) = c/Jx· Además,
supongamos que xi, la medida del gold-standar en la i-ésima unidad, es independiente
de E:i = (ci 1 , . . . , E:ip)t, el vector de errores de medición. Para permitir la posibilidad de
que los errores de medición de los métodos aproximados sobre la i-ésima unidad estén
correlacionados, se asume una estructura de covarianza general sobre E:i, Cov(ci) = I:,
para alguna matriz I: de p x p simétrica definida positiva con elementos CTjk ·

9
Una consecuencia de estas suposiciones es que Cov(yij , xi) = c/Yx y Cov(yij, Yik) = c/Yx + CTjk·
Así, el coeficiente de correlación entre Yij y xi es Pj = c/Yx . Es de notar que pj, con
· c/Yx + CTjj
j = 1, ... ,p, no depende de los elementos fuera de la diagonal de 'E. Por otro lado, como no
es necesario que crjj = crkk, este modelo permite diferentes niveles de acuerdo entre cada
uno de los métodos aproximados y el gold-standard.

Sea Y; = (yi 1 , ... , Yip) t y Zi = (xi, Y;) el vector de dimensión q = p + 1 de datos observados.

Además del modelo, se puede asumir que Z i distribuye normal, luego

Entonces, para calcular su densidad, es necesario obtener el determinante e inversa de su


matriz de covarianza.

v-1

Luego, Zi rv Nq(J.L1lq, V) y su densidad corresponde a

donde

Entonces, se tiene que la densidad de Z i es

Es decir, las variables aleatorias Xi y Di son independientes con distribuciones N(p, c/Yx) y
Np(O, 'E) respectivamente, para i = 1, ... , n.

10
2.1. Estimación por máxima verosimilitud

Tanto para estimación puntual como para el cálculo del error de estimación, es necesario
obtener la función score y las matrices de información observada y esperada.
El logaritmo de la densidad de Zi corresponde a

Luego, la log-verosimilitud es

n n
l(O) = L li(O) = L log(f(zi))
i=l i=l

donde los parámetros de interés son

O= (p, c/Jx, v(E))

con v(E) = i.p los elementos distintos en E .

2 .1.1. Función Seo re

donde DP es la matriz de duplicación,vec{A} es una función que entrega un vector con las
columnas de A apiladas y

2.1.2. Matriz de información observada

11
I ÍJ-LJ-L I iw/>x I ÍJ-L'P

l i,obs (e) h !>x4Yx h !>x'P

o
o
Dtp {-~L::-1
2 ® L::-1 + 1:- 1D·DtL::- 1 ® L::-1} Dp
~ ~

Luego,

l abs(B) = o

2.1.3 . Matriz de información esperada

l esp = E(Iobs)(= Var(U(B)))

1
o
r/Jx
1 o
n o 2rp2
o _ Dt (L::-1 ® 1:- 1)D
2 p p

2.1.4. EMV de J-L, cPx y L:

Desde la función score, es fácil notar que el estimador máximo verosímil para J.J- es el
estimador habitual de la media del gold-standard,

~ i=1 -
¡.J,=--= X
n

12
De igual modo, se deduce que EMV de c/Yx es el estimador habitual de la varianza para xi
n
L(xi- ,U)2
cix = -'-i=_l::..____ __
n

Finalmente, a L: le corresponde el estimador máximo verosímil de la matriz de covarianza


de Di que tiene media cero, entonces

2.1.5. EMV de p

Para un método aproximado

En el caso de que exista un único método alternativo, es decir, p = 1 y el único CYjj = CY;

el modelo se reduce a

Luego, según este modelo, Roy T. St. Laurent (1998) consideró cuatro estimadores ad hoc
para
c/Yx
p = 4Yx + (5'1 -----=-
basado en di = Yi - xi y las sumas de cuadrados
n n n

Sxx = :~::)xi- x) Ldi


2 2
Syy = L(Yi- y) SDD =
i =l i=l i=l

1 n 1 n
y=- LYi x = - l.:xi
n
i=l
n i=l

El primer estimador que varios consideran adecuado es el cuadrado del coeficiente de


correlación muestra! de Pearson, r;, el cual reconocerá la fuerte relación lineal entre Yij y
xi, pero no su grado de acuerdo. Por lo tanto, p = r; sería un pobre estimador de p.

Por otro lado , el segundo estimador se puede entender como la proporción de variación
explicada de Yij por xi en el modelo, ya que es equivalente a un modelo lineal restringido
E( ,,./X
I i i = xi ) = Xi· L uego , p = 1 - -SDD , un estad'1stlco s1m1·¡ar a1 coefi c1ente de
A o o o

8y y
determinación en la regresión lineal.

13
Este enfoque considera los xi como fijos, es decir, como una muestra aleatoria proveniente
de la población. Como los modelos comparados, E(YdXi = xi) = p y E(YiiXi = xi) = xi,
no son anidados, se dificulta la interpretación de p= 1 - SSDD como la proporción de
yy
variación explicada por acuerdo. Además no hay garantía de que este estimador sea no-
negativo.

Un tercer estimador es obtenido considerando separadamente el numerador y denominador


de p. Se tiene que Sx x es estimador insesgado de c/Jx y Syy lo es de c/Jx + ():. Entonces
n-1 n-1
se sugiere p= SSxx. Sin embargo, mientras O ::=; p ::=; 1, la razón entre Sxx y Syy podría
yy
exceder a uno.

El último estimador, y con el cual se trabajará, sigue la idea anterior, pero notando que
S DD es un estimador insesgado de ():. Esto sugiere que
n
Sxx
n-1 1 1
p=
h

Sxx
-
· SDD
- +n- 1
+ (n- 1)SDD 1+ SDD
n-1 nSxx Sxx

Para p métodos aproximados

En muchas ocaciones, como en el ejemplo de la motivación, se cuenta con más de un método


alternativo a comparar con el gold-standard. Luego, volvemos al modelo planteado en la
sección anterior,
Yij = Xi + éij
de donde se tuvo que el coeficiente de correlación intraclase de Yij sobre xi es pj~ cp c/Jx
X+ (Tjj

Como, además del modelo, se asume que xi y Eij distribuyen normal, el estimador máximo
verosímil de pj es
1
Pj = 1 + SDD(j)
Sxx
n
donde SDD(j) = L(Yij- xi) 2 para j = 1, ... ,p
i=l

14
2.2. Distribución muestral de los EMV

Bajo el modelo normal y gracias a la independencia entre xi y Di, se tiene que

~ ~ N(~,~)
2
Xn-1

Por otro lado, se puede decir que la distribución conjunta aproximada de ees
e/v Nno (8, I- (8)) 1

1
donde ne = p(p; ) +2, el largo del vector B, y I (e) corresponde a la matriz de información,
ya sea observada o esperada.

Además, para obtener una distribución para PJ = c/Jx = g( T), se puede usar el
c/Jx + (}jj
método delta,
Jn;(g(f)- g(T)) ,.:__,N (0, u:(f) I~;(f)Ug(f))

donde T = (c/Jx, (}), con(}= ((} 11 , ... , (}PP)t, entonces n 7 = p+1 y

'k =j

, e.o.c.

Y con matriz de información esperada dada por

compuesta por

y Iesp((}) = [ -1 tr ( 'E, -1 ~'E,


é)L, -1 é)L, )]
~
2 u(}JJ u(}kk jk

15
Entonces,

Finalmente,

Por otro lado, dada las distribuciones marginales de c/Jx y r5jj,

c/Jx 2
Jl (n-1-rvx
) c/Jx n-1

y que
c/Jx 1
pj=---
+
c/Jx r5jj

se tiene

2.2.1. Intervalo de confianza para el coeficiente de correlación


intraclase

Por la distribución asintótica de pj, el intervalo de confianza aproximado corresponde a

donde Z 1-a; 2 es el cuantil 1 - ~ de la normal estándar.

Desde la distribución de pj dada por las marginales de c/Jx y r5jj, se obtiene que

donde F(l_;:_a(,~) y F(~~l,n)' son los cuantiles 1- ~y~' respectivamente, de la distribución


Fisher con n - 1 y n grados de libertad.

16
Capítulo 3

COMPARACIÓN DE p MÉTODOS
APROXIMADOS EN PRESENCIA DEL

GOLD-STANDARD

Según St. Laurent (1998), el grado de acuerdo del j-ésimo método aproximado con el
gold-standard, considerando el modelo del capítulo anterior, corresponde a pj = q; cf;x
X+ O"jj

Luego, para probar si los p métodos aproximados tienen igual grado de acuerdo con el
gold-standar, se plantea

Ha : Pl = P2 = · · · = PP

Que es equivalente a testear

Ha : O"n = 0"22 = · · · = O"pp

Por lo tanto, el test de igualdad de correlación intraclase, bajo el modelo gold-standard,


se reduce a testear la igualdad en las varianzas de los p métodos, que se obtiene desde la
diagonal de la matriz I; para la cual sólo se necesita considerar la distribución de los Di,
que corresponde a Np(O, I;)

17
3.1. Test de razón de verosimilitud (TRV)
(Ver apéndice: "Test Asintóticos", Test de razón de verosimilitud)

En el contexto de la comparación de p métodos de medición el test de razón de verosimilitud


es la elección natural para testear la igualdad de varianzas. Sin embargo, es necesario
obtener los estimadores máximo verosímiles (EMV) de parámetros cuya solución no tiene
forma cerrada, por lo tanto, se debe recurrir a algoritmos numéricos para obtener una
aproximación y con ellos calcular el estadístico de contraste.

Bajo el modelo gold standard, la hipótesis de interés es CJ 11 = · · · = O"pp que es equivalente


a Ha : E= 2
CJ \[! donde CJ
2
> O es la varianza común desconocida a la cual deben ser iguales
todos los O"jj y \[! es la matriz de correlación desconocida (simétrica definida positiva).

La función de verosimilitud para E dada por

Bajo la hipótesis alternativa, D es el espacio parámetro en que E es definida positiva.


Luego, como el parámetro no está restringido, el máximo de la función de verosimilitud se
encuentra en el estimador habitual de E.
Es decir,

Entonces, el máximo de la verosimilitud, bajo la hipótesis alternativa, se encuentra en

Ahora para encontrar los EMV bajo Ha, se requiere el cálculo paso a paso: verosimilitud,
lag-verosimilitud y primeras derivadas parciales.

18
Primero, bajo la hipótesis nula, ~ = o- 2 '11, luego

Entonces, se obtiene la log-versimilitud,

-~pn log(2w)- ~pn log(o- 2 ) - ~n log IWI- ~(o- 2 )- 1 t n;w-


i=1
1
Di

Luego, para encontrar los valores de o- 2 y W que maximizan lo anterior, se deriva


parcialmente la ecuación con respecto a cada uno de ellos y se iguala a cero.

Para o- 2 se obtiene

1
==} (}2 = - tr(w- 1 S)
p
Aquí se obtiene una solución para o- 2 , pero en términos de W.

En el caso de W, se tiene
8ln 0 (o- 2 , W)
éJ'lj;ij

i<j

n
w-1sw-1 - W-1] --O, i<j
[ (}
2
ij

Lo cual no tiene solución analítica cerrada para obtener -j;ij

19
Una manera de encontrar solución a este sistema es de forma iterativa, ya sea por Newton
Raphson o Fisher Scoring.

3.1.1. Solución iterativa para encontrar los EMV

Implementar Newton Raphson para{)= (0' 2 , 'l/; 12 , ... , 'l/Jp- l,p) corresponde a iterar

Donde H- 1
[z (J)] es la inversa de la matriz hessiana y U ( JCn)) es la función score,
ambos de la Log-Verosimilitud de {) bajo H 0 .

En el desarrollo previo, ya obtuvimos la función score

U(fJ) =
8lno(0'2, w)
8'lj;ij

Parai<j=2, ... ,v.

Ahora para obtener la matriz hessiana, necesitamos las segundas derivadas y la derivada
cruzada de la lag-verosimilitud con respecto a 0' 2 y 'lj;ij,

82z (fJ) 82l(fJ) 82l(fJ)


8( 0'2)2 80" 28'l/Jl2 80' 28'l/Jp- l ,p

82l(fJ) 82l(fJ) 82l(fJ)


H[l(fJ)] = 8'lj;l280' 2 8'lj;l28'lj;l2 8'lj;l28'l/Jp-l,p

82l(fJ) 82l( fJ) 82l (fJ)


2
8'l/Jp- l ,p80' 8'l/Jp- l,p8'l/Jl2 8'l/Jp- l ,p8'l/Jp-l,p

20
Donde

np 1 1 _1
2 (a-2)2 - (a-2)3 n tr(\ll S)

1 [ -1 -1 8\ll ]
- (a-2) 2n \ll S\ll 8?./Jij ij

8 2l('!9)
8?./Jij8?./Ja{3

Otra solución iterativa

Implementar el algoritmo de Fisher Scoring, es similar a Newton Raphson, pero utilizando


el negativo de la matriz de información esperada, en vez de la hessiana.

J(n+l) = J(n) + I~~ ( J(n)) U ( J(n))


Luego,
E c)2l( '!9)) E ( 82l('!9) ) E ( 82l('!9) )
8(a-2)2 8o- 28?./J12 8a- 28?./Jp-1,p

lesp ( J) = - E ( 82l( '!9) )


8?.j;128o- 2
E ( 82l('!9) )
8?.j;128'1/JI2
E ( 82l('!9) )
8?.j;128·1/Jp-1,p

E ( 82l('!9) ) E ( 82l('!9) ) E ( 82l('!9) )


8?./Jp-1 ,p8o- 2 8?./Jp-l,p8?./J12 8?./Jp-l,p8?./Jp- 1,p

Donde

np 1
----
2 (a-2)2

21
Valores Iniciales

Para ambas soluciones iterativas, los valores iniciales pueden ser tomados desde las
estimaciones muestrales, es decir, 7/Jij = r ij , para i < j , desde R = (rij) que corresponde
a la matriz de correlación muestra!. Y, C5 2 se puede aproximar por el promedio de las
varianzas muestrales,
p

_Lsjj
A2 j=l
(5 = -'-------
p

3.1.2. Planteamiento del test

Una vez calculados 8- 2 y W, se sustituyen en la verosimilitud y se obtiene que


máx:L(C5 2 , w) = (21r)~pn¡o- 2 W/ - ~ exp {-~pn}
no 2
Finalmente,

A su vez, S se puede descomponer como

donde R es la matriz de correlación y D s es una matriz diagonal cuyos componentes


corresponden as= (S , ... , Spp) ; la diagonal de S, es decir, D; 12 = diag( ...;s;;, ... , .¡B;;;).
11

Luego,

/S/ /D}' 2 RD}'2 /


/D//R/
p

/R/ JI sjj
j=l

Esto, junto a que el determinante de una constante por una matriz es la constante elevada
a la dimensión de la matriz por el determinante de la matriz, en este caso /C5 2W/ = (C5 2)P/\[!/ ,
da como resultado que

A=

22
Bajo la hipótesis nula, -2log(A) tiene una distribución asintótica x2 con p grados de
libertad.

Finalmente, si
-2log(A) > x;,I-a
se rechaza H 0 : o- 11 = · · · = app y se concluye que los métodos de medición no tienen igual
varianza .
.·. Las medidas obtenidas por los métodos aproximados no tienen igual grado de acuerdo
con respecto a lo obtenido con el gold-standard.

23
3.2. Test de Wald, Score de Rao y C(a) de Neyman

(Ver apéndice: "Test Asintóticos", Test de Wald, Score de Rao y C(a) de Neyman)

Una forma de escribir la hipótesis 0" 11 =o oo = O"pp de la forma H 0 : Y(O") =O es

Ha : AO" =O

donde O"= (0" 11 , 000 , O"pp)t , los elementos de la diagonal de 2:;, y A es la matriz de contraste
de (p - 1) x p dada por
-1 1 oo o
-1 o1 o o
A= -1 O O 1 O

-1 ooo o 1
Luego, Y' (O") = A y los elementos para construir los estadísticos son:

s, la diagonal de la matriz "E = S


f;- 2 desde "t 0 = &2 Wobtenido de forma iterativa en la sección anterior
1
-L p
sjj desde el estimador consistente ¿;o
-
= (joR
p j=1

Con R la matriz de correlación muestral.

Ui ( O" ) = [ - -1 tr ( ¿:; -1 -82:;


-) 82:; -1 Di ] p
1 t - 1 --2:;
+ -Dii;
2 80"kk 2 80"kk k= 1

Entonces,

24
3.2.1. Estadísticos de los test
1
• W al d : n (A o-) t [AC \o-) A t] - A a-

l • A- 1
• Score: -U(G-o)ti (8-o)U(G-o)
n

Estos estadísticos, bajo la hipótesis nula, distribuye asintóticamente x 2 con p grados de


libertad.

Finalmente, en el contexto de la comparación de métodos en presencia del gold-standard,


se tiene que si el estadísticos es mayor que x;, _a, se rechaza la hipótesis nula H
1 0 : a 11 =
· · · = (}PP y se concluye que los métodos no tienen igual varianza.
:. Bajo el modelo gold-standard, los métodos no tienen igual grado de acuerdo con respecto
al método sin error de medición.

25
Capítulo 4

Aplicaciones
Con el fin de observar el comportamiento de los test estudaremos su aplicación en cuatro
set de datos. Uno simulado para que la hipótesis nula no sea rechazada y otro para que sí lo
sea. Luego, el primer caso con datos reales, correspondiente al utilizado en la motivación, en
que se tiene tres analizadores portátiles y un laboratorio para medir el nivel de colesterol.
Para finalizar con los resultados de cinco exámenes matemáticos, donde uno de ellos será
tomado como gold-standard para medir el grado de acuerdo de los demás sobre él.

4.1. Datos simulados I

Se generó la X= (xl, .. ., Xsoo) donde Xi rv N(J-L =51, rPx = 7), luego se generaron n = 500
diferencias para cada una de las observaciones desde una Np= 4 (0 , :E) , con

2.00 1.36 0.64 1.12


1.36 2.00 0.40 0.88
2::=
0.64 0.40 2.00 1.60
1.12 0.88 1.60 2.00
Es decir, CYjj =2 \fj, entonces, teóricamente pj = 0.77 \fj.
Se obtuvo las siguientes estimaciones;
En el caso del coeficiente de correlación intraclase, los resultados fueron

j-ésimo método 1 2 3 4
P] 0.78 0.77 0.78 0.79
IC 95% ( 0.75 , 0.81 ) ( 0.74 , 0.80) ( 0.75 , 0.81 ) ( 0.76 , 0.82 )

donde es apreciable que todos los intervalos de confianza al 95 % contienen al p1 real y


están superpuestos entre sí.

Los test asintóticos, que prueban H 0 p1 p4 bajo el modelo gold-standard,


entregan los siguientes resultados:

Test de razón de verosimilitud

TRV (p- valor)


3.38 (0.49)

Test de Wald, Score de Rao y C(a) de Neyman, según matriz de información


estimada.

Test (p- valor) Wald Score de Rao C(a) de Neyman


Iobs 6.69 ( 0.15 ) 1.97 ( 0.74) 2.37 ( 0.67)

lu;ut 6.11 ( 0.19) 1.91 ( 0.75 ) 2.34 ( 0.67)


'
Iesp 6.69 ( 0.15 ) 1.98 ( 0.74) 2.37 ( 0.67)

Entonces, como individualmente ningún estadístico es mayor que x¡'.0 95 = 9.48, no existe
evidencia suficiente para rechazar H 0 y se concluye que todos los métodos tienen igual
grado de acuerdo con el gold-standard. Lo cual debe ser así, pues los datos fueron generados
con este fin .

27
4.2. Datos simulados II

Similar a lo anterior, se generó la X = (x 1 , ... , x 500 ) donde Xi "' N(¡..¿ = 51, c/Jx = 7) y se
generaron las n = 500 diferencias para cada una de las observaciones desde una Np= 4 (0, E),
con
1.50 1.10 0.55 1.03
1.10 1.75 0.37 0.87
E=
0.55 0.37 2.00 1.70
1.03 0.87 1.70 2.25
Es decir, O" = (1.5, l. 75, 2, 2.25)' entonces, t eóricamente p (0.82, 0.80, O.78, O. 76) ,
respectivamente.

Obteniéndose los siguientes estimadores máximo verosímiles

1.37 1.03 0.49 0.85


1.03 l. 71 0.40 o.77
íl = 50.95 c/Jx = 6.64 E=
0.49 0.40 1.91 1.54
0.85 o. 77 1.54 l. 99

En el caso de Í: 0 , tanto por Fisher Scoring como por Newton Raphson, el resultado fue

1.73 1.20 0.47 0.89


1.20 l. 73 0.35 O.73 ·
0.47 0.35 1.73 1.32
0.89 0.73 1.32 1.73

Para el coeficiente de correlación intraclase, se tiene

j-ésimo método 1 2 3 4
Pj 0.83 0.80 0.78 0.77
IC 95% ( 0.80 , 0.85) ( 0.77, 0.82) ( 0.75 , 0.81 ) ( 0.74, 0.80)

donde es apreciable que todos los intervalos de confianza al 95 % contienen los


respectivos pj reales y, a diferencia del caso anterior, los intervalos no están superpuestos ,
especialmente los que corresponden al primer y cuarto método.

28
Los tests asintóticos de H 0 : p1 = · · · p4 , bajo el modelo gold-standard , entregan

los siguientes estadísticos y p-valores

Test de razón de verosimilitud

TRV (p- valor)


26.09 ( < 0.001)

Test de Wald, Score de Rao y C(a) de Neyman, según matriz de información


estimada.

Test (p- valor) Wald Score de Rao C(a) de Neyman


lobs 158.52 ( < 0.001 ) 13.77 ( 0.01 ) 15.18 ( < 0.001 )

luiut 137.91 ( < 0.001 ) 12.72 ( 0.01 ) 14.37 ( 0.01 )


'
lesp 158.52 ( <0.001 ) 10.68 ( 0.03 ) 11.72 ( 0.02 )

Entonces, como cada uno de los estadístico es mayor que x~, 0 . 95 = 9.48, existe evidencia
suficiente para rechazar H 0 y se concluye que no todos los métodos tienen igual grado
de acuerdo con el gold-standard, es decir, al menos un método tiene su grado de acuerdo
diferente al de los demás.

29
4.3. Datos Reales I: Nivel de Colesterol (Bangdiwala y
Muñoz 1979)

Estos datos corresponden a los utilizados en la motivación, donde se tiene p =


3 analizadores portátiles (Ektachem, Cholestech, Reflotron) y un gold-standard
(Laboratorio) para medir el nivel de colesterol de n = 47 voluntarios.

Por estimación máximo verosimil se obtuvo

88.47 1.11 32.60


fl = 193.23 r/Jx = 1994.56 ¿; = 1.11 45.45 15.51
32.60 15.51 122.79

Por ambos métodos iterativos para obtener to, el resultado fue

84.68 -1.48 21.94


I:o= -1.48 84.68 15.73
21.94 15.73 84.68

Las estimaciones para el coeficiente de correlación intraclase y su intervalo de confianza


fueron
j -ésimo método Ektachem Cholestech Reflotron

P) 0.95 0.97 0.94


IC 95% ( 0.93, 0.98 ) ( 0.96, 0.99 ) ( 0.90, 0.97 )
donde ya es observable que existe diferencia entre los analizadores portátiles.

Los resultados de los tests asintóticos para probar H 0 p1 P3 en el modelo


gold-standard fueron los siguientes

Test de razón de verosimilitud

TRV (p-valor)
11.61 (0.008)

30
Test de Wald, Score de Rao y C(a) de Neyman, según matriz de información
estimada.

Test (p- valor) Wald Score de Rao C(a) de Neyman


lobs 14.05 ( < 0.001) 68.66 ( < 0.001) 73.56 ( < 0.001)
luiutt 13.48 ( < 0.001) 15.58 ( < 0.001) 13.82 ( < 0.001)
lobs 14.05 ( <0.001) 9.45 (0.02) 16.47 ( < 0.001)

Estudiando cada estadístico individualmente se tiene que: Como no es mayor que


xl 0 .95 = 7.81, existe evidencia suficiente para rechazar H 0 y se concluye que no todos
los analizadores portátiles tienen igual grado de acuerdo con el laboratorio, es decir, al
menos un analizador tiene su grado de acuerdo diferente al de los demás.

4.4. Datos Reales 11: Exámenes matemáticos (Mardia,


Kent and Bibby 1970)

Se tomaron exámenes de cinco temas matemáticos (mecánica, vectorial, álgebra, análisis


y estadística) a n = 88 estudiantes.

Para probar que los grados de acuerdo de cuatro de las pruebas sobre la quinta son
iguales, se tomará el examen de mecánica como gold-standard y los demás como métodos
alternativos.

Los EMV para la media y . varianza del gold-standard y la matriz de covarianza para
las diferencias de los métodos, fueron
El EMV de :Ea por N ewton Raphson y Fisher Scoring fue

367.11 309.89 260.18 199.86


309.89 367.11 305.25 249.13
:Ea=
260.18 305.25 367.11 256.56
199.86 249.13 256.56 367.11

El EMV de p, el coeficiente de correlación intraclase, y su intervalo de confianza fueron

j-ésimo método Vectorial Álgebra Análisis Estadística


P] 0.45 0.46 0.44 0.44
IC 95% ( 0.36 , 0.57 ) ( 0.37 , 0.57 ) ( 0.35 , 0.56 ) ( 0.35 , 0.55 )

donde no se observa grandes diferencias entre los grados de acuerdo de los otros exámenes
sobre el gold-standard.

Los tests asintóticos para la hipótesis Ha : p 1 = · · · = p4 bajo el modelo gold-standard


entregaron los siguientes estadísticos

Test de razón de verosimilitud

TRV (p- valor)


0.33 (0.98)

Test de Wald, Score de Rao y C(a) de Neyman, según matriz de información


estimada.

Test (p- valor) Wald Score de Rao C (a) de N eyman

lobs 1.68 ( 0.79) 0.08 (> 0.99) 0.60 (0.96)


1.74 ( 0.78) 0.13 (>0 .99) 0.98 ( 0.91)
lobs 1.68 ( 0.79) 0.08 (>0.99) 0.64 (0.96)

Entonces, al observar cada estadístico ninguno fue mayor que x¡,a.95 = 9.48, luego no existe
evidencia suficiente para rechazar Ha y se concluye que todos los exámenes tienen igual
grado de acuerdo con el de mecánica.

32
En estos datos se puede evidenciar el hecho que, aunque el grado de acuerdo es igual
entre todos los métodos alternativos y el gold-standard, esta concordancia no es alta.
Esto se puede apreciar en los gráficos de dispersión de cada uno de los exámenes con el de
mecánica. La linea trazada corresponde a la recta de los 45°.

Figura 2: Gráfico de dispersión de los resultados del examen de mecánica vs. los demás
exámenes.

Vectorial vs. Mecánica Álgebra vs. Mecánica

-¡¡; o o
<D ro
.... <D
"§ .o
Q)
tí O)
Q)
.;;:¡:
> o
N
o
N

o o

o 20 40 60 80 o 20 40 60 80
Mecánica Mecánica

Análisis vs. Mecánica Estadística vs. Mecánica

o ro
(.)
o
(/) <D <D

~ ~
""
e ~
<: o (¡) o
N w N

o o

o 20 40 60 80 o 20 40 60 80
Mecánica Mecánica

33
Apéndice

a. Densidad Zi

Para calcular la densidad de Zi fue necesario calcular la inversa de la matriz de covarianzas


y la descomposición de la forma cuadrática.

a. l. Inversa de la matriz de covarianza

La inversa de la matriz de covarianza de Z corresponde a

donde

A I; + q\JlpJI.t - rPxJl.p}f;YxJJ.t

I;+~-~
¿:;

Entonces

v-1=

34
a.2. Descomposición de la forma cuadrática (Ji)

1
!'(xi- J-L) 2 - (Yi- J-l1Lp)tE- 11Lp(xi- J-l)- (xi- J-L)1LtE- (Yi- J-l1Lp)

+(Yi- J-l1Lp)tE- 1 (Yi- J-l1lp)

c/J; 1 (xi- J-L) 2 + (xi- J-L) 21L;E- 11Lp- 2(xi- J-L)1l;E- 1 (Yi- f-l1Lp)
+(Yi- f-l1LpyE- 1 (Yi- f-l1lp)

35
a.3. Función Score

• Para p,
az(e) _ ~ azi(e)
a¡;: - L.t ----¡¡¡;:
•=1

azi(B) xi- p,
--
8p, c/Jx
n

L(xi- p,)
u =-=--
i=--=.1_ __
J.L c/Jx

• Para c/Jx

• Para 'Pij

8li(e) = ~Dt vec p:;-1 D ·Dt¿,-1 _ ¿,-1}


a'P 2 p • •

donde Dp es la matriz de duplicación

36
b. Test asintóticos

b.l. Test de razón de verosimilitud

El test de razón de verosimilitud (TRV) sirve para comparar el ajuste de un set de


datos bajo dos modelos, donde uno (modelo nulo) es un caso especial del otro (modelo
general). El test se basa en la razón de las verosimilitudes, que muestra la proporción de
verosimilitud que se conserva al restringirse al modelo nulo.

El test de razón de verosimilitud fue planteado por Jerzy Neyman y Egon Pearson en
1928. En general se describe:

Sea f¡ el estimador máximo verosímil de 'fJ sobre el rango completo de valores,


D, para cada uno de sus elementos. Similarmente, sea f¡ 0 el que maximiza rJ en
el espacio restringido, D0 , por alguna hipótesis de interés, H 0 .
Finalmente, un estadístico para testear H 0 es

máxL(rJ)
A = _n_o_--,-...,- L(f¡o)
máxL(rJ) L(f¡)
n

donde L( ·) corresponde a la verosimilitud de los datos.

En la práctica, es más fácil usar el doble del negativo del logaritmo, -2log(A) que
distribuye asintóticamente x 2 cuyos grados de libertad corresponden al número de
restricciones que impone H 0 , denotado v .

La región crítica, en la cual se rechaza H 0 con un nivel a, es

-2log(A) > X~,l-a

37
b.2. Test de Wald, Score de Rao y C(a) de Neyman

Considerando la lag-verosimilitud,
n n

i=l i=l

donde w = (w 1 , ... , wn)t, 'Wi es un vector de p x 1, TJ = (TJ 1 , ... , TJnr¡)t y nr¡ es el número de

parámetros.

Luego, la función score es

la matriz hessiana corresponde a

y la matriz de información es

Bajo ciertas condiciones de regularidad, existe f¡ un estimador máximo verosimilitud


consistente. Además, Ur¡ y f¡ siguen una distribución asintóticamente normal:

yÍnU(TJ) ~ N (O, l(TJ))


vn(iJ- TJ) ~ N(o,J(TJ)- 1)

donde J(TJ) = lím Iesp(TJ).


n---;oo

Usualmente se considera los siguientes tres estimadores consistentes de J(TJ)

• Í.,(ij) = Iobs(i]) = - H(ij)

38
Si ij es un estimador consistente de TJ, estos estimadores convergen a J(TJ).

Aunque algunos los tests, como el de \Nald y el de Rao, hayan sido definidos originalmente
en términos de Ío (ij), los otros dos estimadores son frecuentemente más fáciles de
implementar computacionalmente. En muchas situaciones, no es práctico usar l (ij),
0

porque la evaluación analítica del valor esperado I(TJ) = - E(H(TJ)) puede ser muy difícil.

Desde aquí, el término Í(ij), sin subíndice, se referirá a cualquiera de los tres estimadores
anteriores.

Considerando la hipótesis H0 : Y(TJ) = O, donde Y(TJ) es un vector de funciones


continuamente diferenciable de TJ de dimensión ny x 1, con 1 ::; ny ::; nr¡, y suponiendo
que la matriz Y'(TJ) = ;; , de ny x nr¡, es de rango completo (al menos en una vecindad
cercana al verdadero vector de parámetros TJ).

La hipótesis puede ser probada por el test de Wald (1943) , el test score de Rao (1948) y el
test C(a) de Neyman (1959) , entre otros. Los estadísticos de estos tests para la hipótesis
H0 : Y(B) =O son, respectivamente

nY(~)t [Y'(mí(~)- 1 Y'(~)t] -


1
• Wald(Y) = Y(m

• Score(Y) = ~U(~o)tÍ(~o)
n
- 1 U(~o)

~U (iio)tÍ(iio) -
1
1
• N eyman(Y) = y' (iio)t [Y' (iio)Í(iio) - 1 y' (iio)t] - Y' (iio)Í(iio) - 1 U (iio)

donde ~o y ~ son los estimadores máximo verosímiles de TJ con y sin restricción,


respectivamente; y ij0 es un estimador consistente de TJ (al menos bajo H0 ) que satisface
Y(ij 0 ) =O. Además, se asume que Y'(~ 0 ), Y'(~) y Y'(ij 0 ) son de rango completo, al igual
que Í(~o), Í(~) y Í(ijo).

Bajo H 0 , cada uno de los test tiene distribución asintótica x;-r.

39
Se pueden obtener varias generalizaciones del test de Wald al reemplazar el estimador
máximo verosímil f¡ por otro estimador asintóticamente normal ij y Í(f¡)- 1 por un estimador
consistente de la matriz de covarianza asintótica de ij . El estadístico del test de C(a) de
Neyman tiene la importante propiedad de permitir usar cualquier estimador consistente
que cumpla la hipótesis nula, no solo el EMV restringido.

40
c. Newton Raphson

El método de N ewton Raphson es un algoritmo que funciona de manera iterativa para


encontrar raíces de ecuaciones reales de una función f : [a, b] -----+ lR diferenciable en el
intervalo [a,b] y es eficiente para aquellos casos en los cuales no pueden ser obtenidas de
forma analítica. También sirve para encontrar máximos y mínimos de ecuaciones a partir
de la primera derivada.

El método comienza con la elección de un valor inicial elegido por el usuario el cual
debe estar cerca de la raíz buscada.

Se basa en la expansión de Taylor


!" (xi) 1

g(xi) = f(xi) +f 1
(xi)(xi- x) + -f"(xi)
2
2
,-(xi- x) +
3
3
! (xi- x ) + · · ·

Queremos estimar el valor x* (la raíz buscada) mediante f(x*) =O, por lo que se necesita:
2
1 f" (Xi) (Xi+l - Xi)
g(xi+ 1) =O<=====? O= J(xi) +f (xi)(xi+l- xi) + 2
De modo que si Xi+l es muy cercano a Xi entonces (xi+ 1 + xi) 2
~ O y por lo tanto el

problema se reduce a calcular:

f'(xi)xi- f(xi)
! 1(xi)

En el caso en que la función f sea del tipo multidimensional, o sea:

h(x)
h(x)
{(x) =

41
Su derivada corresponde a la matriz Jacobiana

8JI(x) 8fi(x) 8J1(x)


8x1 8x2 ax
8h(x) 8htx)
1= 8x1 8xn

Por lo que despejando se obtiene:

El algoritmo comienza con un valor inicial x 0 , y se realiza:

f(xi)
Xi+l = Xi- j'(xi)

En cada iteración se evalúa el criterio de parada que puede corresponder a /xi+l- xi/ < E

con E ---t o+. Si no se cumple, se debe seguir iterando.

Cuando x 0 está suficientemente cerca de x*, entonces Newton-Raphson converge a x*


al menos cuadráticamente.

42
c. l. Método Iterativo de N ewton Raphson para EMV

En el caso de la estimación máximo verosímil, el algoritmo de N ewton Raphson corresponde


a buscar la raíz de la derivada de la log-versimilitud, por lo tanto, [(xi) = \ll (fj(n)) y el
Jacobiano corresponde a la matriz Hessiana del logaritmo de la verosimilitud .

..,.. Para encontrar el máximo para un parámetro

~(n+l) _ ~ (n)
l' ( r¡~ (n))
r¡ - r¡ - l" (fj(n))

Donde l (ij(n)) es la Log-Verosmilitud de los datos evaluada en la n-ésima iteración


del parámetro, fj(n) .

..,.. Para encontrar el máximo de dos o más parámetros

Donde s - 1 [z (fj(nl)] es la inversa de la matriz Hessiana y \ll (fj(nl) es el Gradiente,


ambos de la Log-Verosimilitud evaluada en la n-ésima iteración de fj(n)

Un criterio de parada que se puede utilizar es

donde E es un valor definido por el usuario, al igual que el valor inicial fj(o) , este valor
puede que sea lejano al real y el mecanismo no converja, por eso dentro de lo posible se
debe evitar el ingreso manual de estos valores.
La norma corresponde a IIAIIoo = máx lail, muy similar al caso univariado, ya que la
2

máxima diferencia es menor que E, luego todas las demás también lo son y se puede
concluir que el algoritmo convergió.

43
c.2. Primera derivada con respecto a '1/Jij

2
olno(J-l, 0" , \!f) = _'!!_ olog [w[
o'l/Jij 2 o'l/Jij
- '!!.(0"2t1 tr (aw-
2 o'l/Jij
s)
1

Luego, se necesita saber que:

• La derivada del logaritmo del determinante de una matriz A= A(a) es

alog [Al = (A- 1 aA)


aa tr oa
• La derivada de la inversa de una matriz A es

• La traza es un operador lineal, entonces

otr(A)
aa
=
.
tr (aA)
oa
Aplicando las dos primeras propiedades, se tiene que

y
aw- 1 = - w-1 aw w-1
o'l/Jij o'l/Jij
Entonces, la log-verosimilitud derivada con respecto a cada elemento distinto de \!f es
Olno (¡.¡,, 0"2' \jJ) n tr (
-- w- 1-aw ) - -((]"
n 2)- 1tr ( -w- 1-w-
8\!f 1S)
o'l/Jij 2 o'l/Jij 2 o'l/Jij

o i<j

44
Como 1]! es simétrica, tr {A : : j } = 2aij y la ecuación anterior se simplifica a

1]!-1S1]!-1 - -1] -
n[ 1]! -O, i<j
(j 2 ..
t]

c.3. Segundas derivadas

La derivada cruzada corresponde a


1
1 1
---ntr (81]1-
- - S)
2 k2)2 0'1/Jij

1 [ -1 -1 81]! ]
= - (()2 )2 n 1]! S1]! 81/Jij ij

Finalmente, la derivada cruzada entre 1/Jij y 1/Ja./3

82 Z(e)
8'ljJij81/Ja.{3

1 1
n _1 (81]1-
--S1]!-1 + 1]1-1 S81]1-
- - ) + 1]1-1 _
81]!
_ 1]1-1 ]
[ ()2 81/Ja.{J 81/Ja.{J 81/Ja.{J ij

45
Anexo

1. Datos Mardia, Kent and Bibby 1970

Se puede obtener desde R - eran con el siguiente código

install. packages ( "bootstrap")


library(bootstrap)
scor

46
ii. Datos Bangdiwala y Muñoz 1979
No Laboratorio Ektachem Cholestech Reflotron
1 201 201 193 197
2 128 127 127 118
3 142 141 144 138
4 174 173 166 169
5 175 173 165 171
6 215 213 204 207
7 207 205 196 204
8 186 184 185 190
9 185 183 177 164
10 309 311 306 314
11 234 236 226 233
12 161 164 157 147
13 135 132 135 119
14 200 197 200 194
15 235 232 224 239
16 183 186 180 178
17 176 172 173 168
18 260 265 251 259
19 185 190 184 180
20 132 137 133 119
21 147 142 160 133
22 160 155 151 138
23 119 114 123 100
24 155 161 154 155
25 167 161 160 159
26 164 158 162 133
27 260 266 242 249
28 141 135 145 138
29 244 251 238 238
30 231 224 241 238
31 156 148 162 153
32 181 189 173 189
33 129 120 129 103
34 172 163 168 177
35 271 261 274 273
36 145 135 146 128
37 232 244 226 224
38 220 208 212 223
39 191 179 189 173
40 173 186 169 180
41 188 174 188 170
42 207 191 214 208
43 189 173 189 180
44 254 235 246 258
45 255 236 248 253
46 245 224 236 242
47 263 237 263 258

47
Referencias

l. ANDERSON, Theodore. An introduction to Multivariate Statistical Analysis. John


Wiley & Sons, New York, 1966.

2. BANGDIWALA, Shrikant and MUÑOZ, Sergio. Medición de Confiabilidad y Validez


de Instrumentos Clínicos. Revista Médica de Chile, 125: 466-473, 1997.

3. DAGENAIS, Marcel G. and DUFOUR, Jean-Marie. Invariance, Nonlinear Models,


and Asymptotic Tests. Econometica, 59(6): 1601-1615, 1991.

4. DONNER, Allan. A Review of Inference Procedures for the Intraclass Correlation


Coefficient in the One- Way Random Effects Model. International Statistical Review,
54(1): 67-82, 1986.

5. FISHER, Ronald A. Statistical Methods for Research Workers. Oliver and Boyd,
Edinburgh, 1925.

6. GALEA, Manuel and VILCA, Filidor. Hypotheses testing for comparing means and
variances of correlated respondes in the symmetric non-normal case. Chilean Journal
of Statistics, 1(2): 113-123, 2010.

7. HARRIS, Jan R., BURCH, Brent D. and ST. LAURENT, Roy T. A Blended
Estimator for Measure of Agreement with a Gold Standard. Journal of Agricultura!,
Biological, and Environmental Statistics. 6(3): 326-339, 2001.

8. HARRIS, P. Testing for variance homogeneity of correlated variables. Biometrika,


72(1): 103-107, 1985.

9. MARDIA, K. , BIBBY, J. and KENT, J. Multivariate analysis. Academic Press,


London, 1979.

10. MODARRES, Reza. Testing the Equality of Dependent Variances. Biometrical


Journal, 35(7): 785-790, 1993.

11. ST. LAURENT, Roy. Evaluating agreement with a gold standard m method
comparison studies. Biometrics, 54: 537-545, 1998.

48

Potrebbero piacerti anche