Sei sulla pagina 1di 4

Prueba de hiptesis para verificar la independencia

estadstica entre dos variables aleatorias


Plinio R. Carracedo Gonzlez

Resumen Durante la realizacin de las investigaciones aleatorios y partiendo de esos principios, una vez obtenidas las
aplicando los mtodos de Montecarlo, es preciso simular variables aleatorias correspondientes aplicar una prueba de
determinadas leyes de distribucin que exigen independencia hiptesis que permita determinar el nivel de correlacin de
estadsticas entre las variables aleatorias que la forman. Sin rango entre dichas variables y con ello, dar un dictamen de su
embargo, stas se implementan a partir de los generadores de independencia estadstica que facilite as, poder simular la ley
nmeros pseudo aleatorios que vienen dentro del paquete de
software que posee la mquina computadora digital y por regla
de distribucin deseada.
general, stos tienen un nivel de correlacin dado lo cual
perjudica la aplicacin del mtodo. II. DESCRIPCIN DE LOS GENERADORES DE NMEROS
El presente trabajo aborda como se soluciona la problemtica PSEUDOALEATORIOS
planteada, aplicando una prueba de hiptesis que permite Por sus caractersticas generales de obtencin, los nmeros
determinar el nivel de correlacin de rango entre dichas aleatorios se pueden clasificar en:
variables aleatorias y con ello, dar un dictamen de su Nmeros aleatorios.
independencia estadstica para simular, la ley de distribucin
Nmeros cuasi aleatorios.
deseada.
Nmeros pseudos aleatorios.
Abstract During achievement of the research applying
Los nmeros aleatorios [1, 2] propiamente dicho no pueden
Monte Carlos methodos, is precise to simulate determined laws ser generados para su obtencin, por mquinas computadoras
of distribution that require statistical independence among at digitales basadas en algoritmos recursivos de trabajo. Su
random variables that is formed. However they get into a great at adquisicin ocurre, mediante la importacin desde fuentes
random generators that are included in the digital computer externas a stas que pueden ser: tablas especiales, generadores
machines software. de descomposicin nuclear, memorias y otros.
Generally, there is correlations that affect the method Los nmeros cuasi aleatorios [3, 4], son creados por
application. algoritmos destinados a la refinacin de caractersticas que
The work deal with the present problem and its solution. provienen de las secuencias de ellos, con distribuciones
uniformes entre cero y uno.
Los nmeros pseudos aleatorios [5, 6, 7] como su nombre lo
indica, se obtienen sobre la base de algoritmos programados a
partir de formas iterativas. Sin embargo, aparentemente tienen
I. INTRODUCCIN una gran semejanza a los aleatorios y poseen determinadas
Durante la realizacin de las investigaciones aplicando los exigencias entre las que se encuentran:
mtodos de Montecarlo, es preciso simular determinadas leyes 1. Buenas caractersticas estadsticas, donde a partir de un
de distribucin que exigen independencia estadsticas entre las test tanto terico como emprico, se compruebe la calidad
variables aleatorias que la forman. Sin embargo, stas se de ellos, hacindolos aptos para una aplicacin.
implementan a partir de los generadores de nmeros pseudo 2. Largo perodo el cual est relacionado con las frmulas
aleatorios que vienen dentro del paquete de software que iterativas que los crean y, por tanto, su estado siempre se
posee la mquina computadora digital y por regla general, guarda como un nmero entero y por consiguiente, no
stos tienen un nivel de correlacin dado lo cual perjudica en pueden tener ms estados que el nmero mximo de
un momento dado la aplicacin del mtodo. enteros.
Una de las formas de solucionar la problemtica planteada, Adems de estas dos exigencias ellos tambin, deben tener
consiste primeramente conocer los mtodos generales en que reproductividad y portabilidad. Esta ltima se relaciona con la
elaboran computacionalmente los generadores de nmeros posibilidad de que los generadores que elaboren estos tipos de
CCIA2008 2

nmeros, puedan ser empleados en diferentes lenguajes de Para corroborar que no exista dicha correlacin, es
programacin. De aqu se deriva otra exigencia que se imprescindible aplicar una prueba de hiptesis estadstica que
relaciona con una implementacin eficiente. verifique la independencia existente entre esas variables
Para la realizacin de una implementacin de esa ndole, en aleatorias.
las mquinas computadoras digitales se emplean diferentes
algoritmos basados en frmulas de generadores pseudos III. CRITERIO DE CORRELACIN DE RANGO DE SPEARMAN
aleatorios. Uno de estos generadores es el denominado
congruencial lineal, que tambin es llamado congruencial Cuando se trata de un gran volumen de la muestra, para
mezclado. Los trabajos sobre estos tipos de generadores estimar la dependencia entre las variables aleatorias, se utiliza
fueron propuestos por Lhemer [6, 7] en 1948 aunque no se como prueba de hiptesis, las correlaciones de rango [9].
publicaron hasta 1951. El principio de funcionamiento de este Dentro de ellas encuentra el coeficiente de correlacin de
generador se basa en la frmula recursiva: rango de Spearman S [9].
[ ]
f (x i + 1) = af ( x i ) + c mod m (1) Sea (a1, a2) el volumen de una muestra de observaciones de las
Donde: variables aleatorias continuas A1, A2 [9].
a, c, m constantes enteras positivas. A cada valor a1i, (i = 1,2,..., n ) , se le asigna el rango a1, o
mod valor tomado como el resto despus de efectuar la sea, el nmero del elemento ai en la serie varacional
divisin de dos nmeros.
a (1) , a (2 ) ,......, a (n ) .
Cuando la variable independiente de la funcin toma el valor
De modo anlogo se determinan los rangos a2 de los
inicial f ( x 0 ) , entonces a ese valor se le denomina semilla
elementos a2i, (i = 1,2,..., n ) . De esta manera, a cada par (a1,
del generador [5, 6, 7].
a2) le corresponde un par de rangos (a1, a2).
Si la constante c es igual a cero, el generador se nombra
Se calcula el coeficiente de correlacin basndose en la
multiplicativo, mientras que si m corresponde a un nmero
muestra de rangos. El valor rS obtenido, se denomina valor
primo, entonces el perodo del generador p es:
muestral del coeficiente de correlacin de rango de Spearman
p = m 1 (2) que caracteriza la dependencia entre las variables aleatorias
Una eleccin prctica para los generadores multiplicativos A1, A2 [9] y se determina por la expresin:
[5, 6], es cuando los coeficientes a y m toman los valores:
a = 16807 6
n
(a 1 a 2 )2
(3) (6)
m = 2 1
31 rS = 1 i =1
(
n n2 1 )
Al sustituir estos valores en la frmula del generador se
obtiene: Donde:
f ( x i + 1) = (16807x i ) mod(2 31 1) (4) rS valor muestral del coeficiente de correlacin de rango de
Con un perodo igual a: Spearman.
p = 2 31 2 (5)
a ;a - muestras de rangos de las variables aleatorias.

1 2

Y el valor inicial de xi constituye la semilla de dicho n magnitud de la muestra elegida de las variables aleatorias.
generador.
Cuando se analizan los generadores congruenciales, cada El coeficiente rS, es una medida no paramtrica [9] de
juego de valores escogidos, es generalmente considerado relacin y por consiguiente, puede utilizarse en caso de una
como un generador separado con sus propiedades especficas. distribucin continua arbitraria de la poblacin madre.
Con una buena eleccin de los valores de sus parmetros, Para calcular el valor muestral del coeficiente, se utilizan dos
estos generadores entregan a su salida nmeros pseudos hiptesis que son:
aleatorios [8] que pueden ser empleados en diversas
aplicaciones. No obstante a su descripcin, estos presentan las Primera hiptesis:
siguientes deficiencias: Ho : S = rS = 0 (7)
1. Perodo relativamente corto que puede consumirse en
simulaciones de mediana complejidad. Si se cumple la hiptesis, se acepta Ho y no hay correlacin de
2. Los vectores D-dimensionales (x1, x2, x3,,xD); (xD+1, rango entre las variables aleatorias analizadas lo cual significa
xD+2,xD+D); .... formados por nmeros pseudos que son independientes entre s. De no cumplirse sta, se
aleatorios uniformemente distribuidos de 0 a 1, descasan desarrolla una segunda hiptesis:
en hiper planos paralelos entre s.
Debido a todo lo antes mencionado, los nmeros aleatorios Segunda hiptesis:
obtenidos a partir de estos generadores cuando se utilizan para H1 : S = rS 0 (8)
formar ms de una variable aleatoria y adems se necesite Donde:
como requisito la independencia estadstica entre ellas, no H1 - condicin que describe la segunda hiptesis.
siempre se cumple esta ltima condicin producto entre otras De cumplirse ella, se realiza la verificacin para el volumen de
cosas, a la existencia de un determinado grado de correlacin la muestra n 9 por el valor de la estadstica [9]:
entre ambas variables aleatorias.
CCIA2008 3

T (n 2) = t m = rS
(n 2) cada uno de los trminos a(i)2, le corresponde a su

(1 r )
2
(9) vez, un valor de rango de la serie varacional de la
S muestra de la variable aleatoria a1. Ese rango de a1 es
Donde: el valor de rango que se le otorga a a2, obtenindose
t(n-2) cuantl de la distribucin de Student con (n-2) grados de esa manera un par (a1, a2).
de libertad. (Ver el valor que toma ste en la tabla S7 5. Se calcula la diferencia de cada una de las parejas de
[9]). rango (a1-a2) de la muestra obtenida.
Si se cumple que: 6. Se eleva al cuadrado el resultado anterior y los
t m > t (1 2 ) (n 2)
(10) valores obtenidos se suman.
7. La magnitud de la suma se sustituye en la expresin
Donde: rs, sta se calcula y se obtiene su valor. Si es igual a
- nivel de significacin de la probabilidad confidencial cero, directamente se puede afirmar que no hay
p = 1- /2. correlacin de rango lo cual significa que hay
Entonces finalmente se rechaza la hiptesis Ho lo cual independencia estadstica entre dichas variables
significa que existe una dependencia de correlacin de rango aleatorias.
entre las variables aleatorias analizadas. 8. Si es desigual de cero, entonces se determina el valor
Al rechazar la hiptesis, se debe generar otra nueva variable muestral de la estadstica tm en funcin del volumen
aleatoria y volver aplicar el criterio hasta lograr que ste se de la muestra y el cuantl de la distribucin de
cumpla. Student de n 2 grados de libertad, dada una
Una vez realizada la prueba de hiptesis, esas variables probabilidad confidencial con un nivel determinado
aleatorias se guardan en un fichero y a partir de ellas se de significacin.
pueden realizar la simulacin de la ley de distribucin 9. Se aplica el criterio estadstico y si se cumple,
requerida y con ello aplicar los mtodos de Montecarlo en la entonces se rechaza la hiptesis H0 lo cual significa
solucin de procesos. que existe una dependencia de correlacin de rango
Finalmente la sntesis de los pasos del algoritmo queda entre las variables aleatorias analizadas. En este caso,
conformada de la siguiente manera: hay que nuevamente seleccionar dos volmenes de
1. Se generan las variables aleatorias A1 y A2 y de ellas muestras de dichas variables aleatorias y someterlas
se toma el volumen de una muestra (a1, a2) en cada al criterio hasta que se cumpla con el requisito.
momento de tiempo t, las que se representan como: 10. Una vez obtenida la independencia estadstica entre
a1 = rand ( )1 (11) dichas variables, stas se guardan en un fichero y a
partir de aqu pueden ser empleadas en la obtencin
a 2 = rand ( )2 (12) de leyes de distribucin y aplicar con ellas, los
Donde: mtodos de Montecarlo en la solucin de problemas.
rand ( ) generador de nmeros aleatorios El algoritmo entonces puede ser representado en la siguiente
congruencial lineal que produce un figura.
nmero entero aleatorio entre 0 y
Inicio
RAND_MAX.
RAND_MAX operador que devuelve el
mximo de los nmeros
Se generan volmenes de muestras a1, a2 de las
enteros aleatorios.
variables aleatorias A1, A2.
2. Se establece en forma varacional la muestra de la a1 0 0,4 0,2 0,1 0,8 0,3 ., n
variable aleatoria a1 y se le otorga un rango a la a2 0,7 0,1 0,5 0,9 0,4 0,2 ., m
misma a(i)1 dando para ello, un valor ascendente
donde (i = 1,2,..., n ) . Como resultado se tiene una Se coloca en forma varacional el volumen de la
muestras a(i)1 i =(1,2,.,n)
serie de trminos a(i)1 con su rango correspondiente y,
a(i)1 0 0,1 0,2 0,3 0,4 0,8,..., n
a cada uno de ellos, le corresponde un valor de la a2 0,7 0,9 0,5 0,2 0,1 0,4,..., m
variable aleatoria a2 que tena antes de situarse a1 en
forma varacional. Estos se van organizando en pareja
Se determina el rango de a1
hasta el ltimo elemento de la muestra. a1 1 2 3 4 5 6,..., n
3. Se sustituye a1 por su rango (valores de i) y se coloca a2 0,7 0,9 0,5 0,2 0,1 0,4,., m
la muestra de la variable aleatoria a2 tambin en
forma varacional, obtenindose una nueva serie de
trminos a(i)2 donde (i = 1,2,..., n ) . Se coloca en forma varacional el volumen de la
muestra a(i)2 i =(1,2,.,n)
4. El rango de la nueva muestra a(i)2 se determina a1 1 2 3 4 5 6 ,..., n
tomando desde el menor valor de la serie situada a a(i)2 0,1 0,2 0,4 0,5 0,7 0,9,..., m
partir de la izquierda de ella y comparndose con su
igual en la muestra de la variable aleatoria a2 que es 1 2
funcin del rango de a1. De ah, consecutivamente
CCIA2008 4

[3] Gmurman, E. V, Teora de la probabilidades y estadstica


1 matemtica, Editorial Pueblo y Educacin, 1979.
2
[4] Tijonov, B.I., Transformaciones no lineales de procesos
(i) aleatorios, Editorial Radio y Comunicacin, Mosc URSS, 1986.
Se determina el rango de a 2 comparando el valor
que toma ste con el rango de a1 [5] O Connell, R, Generadores de nmeros pseudos aleatorios,
a1 1 2 3 4 5 6 ,..., n Univeresidad Brunel, 1999.
a2 5 4 6 3 1 2,..., m
[6] Wichmann, B. A., Generadores de nmeros pseudos aleatorios,
NPL report, nacional Physical Laboratory, 1982.
Se calcula la diferencia de rangos a1 - a2 y se eleva al
cuadrado
[7] Reif, R. C. y Tigar, J. D., Generadores de nmeros pseudos
a1- a2 (1 -5) (2-4) (3-6) (4-3) (5-1) (6-2) (n-m)
aleatorios paralelos eficientes, 1985.
(a1- a2)2 16 4 9 1 16 16 (n-m)2
[8] Knut, D. E., El arte de la programacin computacional, Vol. 2.
Algoritmos semi numricos, 1969.
Se suman los cuadrados, se sustituye en la frmula
de rs y se calcula su valor. [9] Colectivo de Autores, Problemas de las Matemticas Superiores
III, Editorial MIR, Mosc, 1986.

SI NO Plinio R. Carracedo Gonzlez, Doctor


rs= 0 en Ciencias Tcnicas, Investigador
Auxiliar y Profesor Titular. Graduado
como ingeniero en el Instituto Tcnico
a1 , a2 son Militar Jos Mart, Orden Antonio
independientes Calcular tm Maceo desde el ao 1986 donde labora
actualmente. Posee ms de dos dcadas
de experiencia como docente en la
Guardar en un Enseanza de nivel Superior y adems,
fichero NO SI
tm> t(1-/2)(n-2) como investigador. Ha recibido e
impartido varios cursos de superacin
profesional y de formacin acadmica
FIN de postgrado, participando tambin en
diversos eventos cientficos.
Ha realizado publicaciones y elaborado manuales y un libro, todos ellos de
Hay correlacin carcter cientfico. Posee una distincin y dos condecoraciones por la actividad
a1 , a2 son de rango cientfica.
independientes

Guardar en un
fichero

FIN

Fig. 1 Algoritmo del criterio de correlacin de rango de Spearman.

IV. CONCLUSIONES
Los principales aspectos descritos hasta aqu, facilitan el
modelado y simulacin computacional de leyes de distribucin
sobre la base de variables aleatorias independientes entre s,
verificadas a partir del criterio de correlacin de rango. Se
desarroll adems, la sntesis del algoritmo para crear y
obtener empleando los generadores de nmeros pseudos
aleatorios, los juegos de valores de variables aleatorias no
correlacionadas entre s.

REFERENCIAS
[1] Calero Vinelo, Arstides, Teora de la Estimacin, Editora
Ministerio de Educacin Superior, Ciudad de La Habana, 1985, pp.
12-16.

[2] Rairfield, R. C. y Col, Generadores de nmeros aleatorios, (SE),


1984, pp. 203-230.

Potrebbero piacerti anche