Guia Basica para La Simulacion de Monte Carlo PDF

Juan Carlos Lpez Ag
Gua bsica para

la simulacin de
Monte Carlo
ndice
Captulo 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1. Principios de la simulacin de Monte Carlo . . . . . . . . . . . . . . . . . . 16
Captulo 2. Generacin de nmeros pseudoaleatorios . . . . . . . . . . . . . . . 31
Captulo 3. Generacin de variables aleatorias no uniformes mediante
el principio de inversin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Captulo 4. Algunas funciones de distribucin inversas o aproxima-
ciones de ellas incluidas en la aplicacin Excel
TM
. . . . . . 51
4.1. Distribucin binomial, B(n; n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2. Distribucin beta, beta(a ; b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3. Distribucin normal o gaussiana, N(k ; p
2
) . . . . . . . . . . . . . . . . . . 54
4.4. Distribucin lognormal LN(k ; p
2
) . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.5. Distribucin gamma, gamma (a ; b) o I(a ; b) . . . . . . . . . . . . . . . 56
4.6. Distribucin Ji-cuadrado, s
2
(l) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.7. Distribucin exponencial, Exp(j) . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.8. Distribucin t de Student, t(l) o t
l
. . . . . . . . . . . . . . . . . . . . . . . . . 60
4.9. Distribucin de Snedecor-Fisher, (l
1
; l
2
) . . . . . . . . . . . . . . . . . 63
Captulo 5. Simulacin de distribuciones truncadas por el mtodo de
inversin o de la transformada inversa . . . . . . . . . . . . . . . . . . . 67
el mtodo de rechazo o de aceptacin/rechazo . . . . . 71
el empleo de transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Captulo 8. Mtodos especficos para la simulacin de variables aleato-
rias no uniformes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
8.1. Distribucin normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
8.1.1. Mtodo de Box-Mu
ller, o mtodo polar . . . . . . . . . . . 88

8.1.2. Variante de Marsaglia del mtodo polar . . . . . . . . . . . . 89
8.1.3. Mtodo del teorema central del lmite . . . . . . . . . . . . . . 90
8.1.4. Mtodo de Ahrens-Dieter . . . . . . . . . . . . . . . . . . . . . . . . . 91
8.1.5. Mtodo de rechazo con la doble exponencial como
distribucin auxiliar para el muestreo . . . . . . . . . . . . . . . 92
8.1.6. Mtodo del cociente de uniformes . . . . . . . . . . . . . . . . . 93
8.1.7. Mtodo de aceptacin/rechazo con la logstica como
distribucin auxiliar para el muestreo (Propuesta del
autor) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.2. Distribucin de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
8.3. Distribuciones gamma y Erlang, gamma (a ; b) y Erl (a ; b) . . . 104
8.3.1. Algoritmo de Cheng y Feast para a b1 . . . . . . . . . . . . 106
8.3.2. Variante de Fishman para a b1 . . . . . . . . . . . . . . . . . . . . 106
8.3.3. Algoritmo de Tadikamalla para a b3/4 . . . . . . . . . . . . 107
8.3.4. Algoritmo de Ahrens y Dieter para 0aa m1 . . . . . . 107
8.4. Distribucin beta (a ; b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.4.1. Algoritmo de Fox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8.4.2. Algoritmo de Jo
hnk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.4.3. Algoritmo de Cheng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.5. Distribucin Ji-cuadrado de Pearson, s
2
(l) . . . . . . . . . . . . . . . . . 112
8.6. Distribucin de Snedecor-Fisher, (l
1
; l
2
) . . . . . . . . . . . . . . . 114
10 ndice
8.7. Distribucin t de Student, t(l) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.8. Distribucin de Weibull, W(a ; b) . . . . . . . . . . . . . . . . . . . . . . . . . . 116
8.9. Distribucin logstica, Logist (a ; b) . . . . . . . . . . . . . . . . . . . . . . . . . 116
Captulo 9. Simulacin de estadsticos ordenados . . . . . . . . . . . . . . . . . . . 119
Captulo 10. Los criterios de aceptabilidad y simulacin estadstica . . . 135
Bibliografa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
ndice 11
Introduccin 1
Para los objetivos de esta gua bsica, simulacin ser sinnimo de generacin
de datos artificiales en un ordenador. Entre sus objetivos podemos destacar los
siguientes (DAVISON, A.C. Cambridge Series in Statistical and Probabilistic
Mathematics. Cambridge. 2003 {12}):
a) estudiar la variabilidad que puede esperarse al muestrear en un determinado
modelo estadstico,
b) evaluar el grado de adecuacin de una aproximacin terica determinada,
c) realizar anlisis de sensibilidad de las conclusiones de un estudio en relacin
con las hiptesis adoptadas,
d) aportar mayor luz respecto de un supuesto o intuicin, sobre la base de que
es preferible una respuesta incompleta a una cuestin correctamente formula-
da, que una respuesta precisa a una cuestin incorrecta,
e) proporcionar solucin numrica a un determinado problema estadstico
cuando la solucin analtica o no existe o si existe es demasiado compleja,
f) proporcionar solucin numrica a un determinado problema matemtico
pero de raz no directamente estadstica cuando la solucin analtica o
no existe o si existe es demasiado compleja.
g) servir de apoyo a los mtodos clsicos de enseanza de la Estadstica.
La simulacin es, por otra parte, una manera econmica y til de experimenta-
cin. En muchas ocasiones, el cientfico o el tcnico se encuentran con sistemas
reales cuyo funcionamiento desea controlar o mejorar. Un mtodo habitual para
alcanzar esos objetivos consiste en experimentar con el sistema real, si ello es posi-
ble, e intentar utilizar los resultados de la experimentacin para conocer y mejorar
el funcionamiento del sistema. En muchas ocasiones, sin embargo, tal experimen-
tacin es imposible o, aun siendo posible, ticamente delicada por ejemplo en
Biologa o muy costosa, siendo conveniente disponer de algn mtodo alterna-
tivo para ampliar el conocimiento del sistema real. Dos son las posibilidades (Fi-
gura 1.1). Construir fsicamente un prototipo, versin simplificada del sistema real,
o crear un modelo lgico-matemtico que describa mediante un conjunto de ecua-
ciones especificacin las relaciones bsicas entre los principales elementos del
sistema, para experimentar con ellos y no con el sistema. La simulacin hace refe-
rencia en este escenario a la experimentacin con el modelo, sobre todo cuando
como suele ser general no son suficientes los procedimientos analticos y nu-
mricos para su estudio, ya que el modelo incluye trminos de ruido o perturba-
ciones aleatorias que son esenciales en el mismo, pues sintetizan el reconocimien-
to de que el modelo es slo una aproximacin del sistema real.
Figura 1.1. Experimentacin con el sistema, los modelos y los prototipos.
La Figura 1.2 muestra de forma esquemtica el funcionamiento de un modelo de
un determinado sistema real. Existen unas entradas, tanto estocsticas como
deterministas, y unas salidas. El proceso de conversin de las entradas en salidas
no es una caja negra black box como sera si en ese mismo tipo de figura se
14 Gua bsica para la simulacin de Monte Carlo
describiese el sistema real o incluso un prototipo del mismo. Por definicin, las
ecuaciones constitutivas del modelo es decir, su especificacin son conocidas,
de modo que el proceso interno de transformacin de las variables de entrada en
variables de salida es conocido y fijo una vez construido el modelo, y general-
mente establecido en forma de algoritmo.
Figura 1.2. Representacin esquemtica de las ecuaciones lgico-matemticas
y relaciones que constituyen el modelo.
La simulacin consiste en la observacin y explotacin de resultados que sigue a
un plan estructurado de aplicacin extensa del modelo. El analista hace variar de
forma ordenada las entradas del modelo y obtiene como respuesta un gran nme-
ro de salidas u observaciones artificiales que analiza estadsticamente para extraer
conclusiones del propio modelo y extrapolarlas al sistema real para prever su com-
portamiento.
Los procedimientos o experimentos de simulacin pueden diferir dependiendo de
si el conjunto de salidas u observaciones potenciales es discreto o continuo. Ade-
ms, dichas observaciones pueden ser estticas o dinmicas, y en este ltimo caso
como funcin continua o discreta del tiempo. Por otro lado, las medidas del com-
portamiento del sistema tambin pueden variar enormemente segn el modelo.
Con tal abanico de posibilidades no es fcil al principio realizar una taxonoma de
los procesos de simulacin. Sin embargo, la mayora de los experimentos de simu-
lacin, una vez construido el modelo que simplifica el sistema real, se pueden
adaptar al siguiente esquema (ROS INSA, D., ROS INSA, S. y MARTN, J.
Simulacin. Mtodos y aplicaciones. RA-MA. 1997 {37}):
1. Obtencin de observaciones bsicas de una fuente de nmeros aleatorios.
2. Transformacin de las observaciones bsicas en entradas al modelo, segn las
especificaciones del mismo para las entradas estocsticas y deterministas.
3. Transformacin de las entradas deterministas y estocsticas en salidas.
4. Estimacin de las medidas o pautas de comportamiento del sistema mediante
el anlisis estadstico de las salidas del modelo.
Introduccin 15
1.1. Principios de la simulacin de Monte Carlo
Dentro del contexto general de los procesos de simulacin que acaba de ser ex-
puesto, los mtodo calificados de Monte Carlo inciden en la ltima fase del es-
quema general de los experimentos de simulacin, constituyendo unos mtodos
de estimacin bastante potentes de parmetros de inters del sistema real. Para
llevar a cabo esa estimacin el mtodo de Monte Carlo explota ampliamente la
analoga entre probabilidad y volumen. La Estadstica Matemtica formaliza la
nocin intuitiva de probabilidad de un suceso identificndola con su volumen o
medida relativa en relacin con el del universo de posibles resultados de un experi-
mento aleatorio. El mtodo de Monte Carlo utiliza esa identificacin en la direc-
cin opuesta, es decir calculando el volumen de un conjunto e interpretando
dicho volumen como una probabilidad. En el caso ms simple eso significa llevar a
cabo un muestreo aleatorio del universo de resultados posibles, hacer el recuento
de los resultados que pertenecen a un determinado conjunto, calcular la fraccin
de los resultados pertenecientes a dicho conjunto con respecto al nmero total de
resultados generados, y tomar dicha fraccin como una estimacin del volumen
de dicho conjunto. Dentro de unas hiptesis bastante generales, la ley de los gran-
des nmeros nos asegura que esa estimacin converge al verdadero valor del vo-
lumen del conjunto a medida que aumenta el nmero de resultados generados
artificialmente. Adems, y de forma crucial, el teorema central del lmite facilita
informacin sobre la magnitud del error de estimacin cuando el tamao de la
muestra generada es finito, como por otra parte simpre va a suceder.
De gran utilidad para la aplicacin de la metodologa Monte Carlo resulta tam-
bin la identificacin de la probabilidad de un suceso con la esperanza matemtica
de cierta funcin que pasa a ser, por mor de esa identificacin, la caracterstica de
mayor inters de una variable aleatoria o de una funcin de ella. Sea X una variable
aleatoria unidimensional, f(x) su funcin de densidad y D el soporte de dicha va-
riable, de modo que
I
D
f (x) dx %1. [1.1]
Como es bien sabido, la esperanza matemtica de dicha variable aleatoria es
E[X] %
I
D
xf (x) dx, [1.2]
y la esperanza matemtica de la funcin g(X), que puede ser considerada tambin
como una nueva variable aleatoria obtenida por transformacin de la primera,
E[g(X)] %
I
D
g(x) f (x) dx. [1.3]
Sea ahora S un subconjunto de D, S D. La probabilidad del suceso X S es,
como se sabe,
Pr (X S) %
I
S
f (x) dx, [1.4]
donde la integral est extendida al conjunto de valores contenidos en S.
Considrese la funcin indicadora de pertenencia a un determinado conjunto S,
definida en la forma:
S
(x) % [x S] %
E
1 si x S
0 si x S ( x S1).
[1.5]
Ntese que con ayuda de esta funcin indicadora la probabilidad Pr (X S) puede
tambin expresarse en la forma
Pr (X S) %
I
D
S
(x)f (x) dx, [1.6]
pues por mero desarrollo de la misma, considerando que S S1%D, se obtiene
I
D
S
(x)f(x) dx %
I
S
1 f(x) dx !
I
S1
0 f(x) dx %
I
S
f(x) dx, [1.7]
que concuerda con [1.4] como se quera demostrar.
De modo que tanto [1.4] como [1.6] son expresiones vlidas y alternativas de
Pr (X S), pero [1.6] es un caso particular de [1.3], es decir es una esperanza
matemtica, concretamente de la funcin
S
(x), por lo que se llega a la importante
conclusin,
Pr (X S) %E[
S
(x)], [1.8]
que identifica la probabilidad de que X pertenezca a S con la esperanza matemti-
ca de la funcin indicadora de pertenencia de X a S. Esta expresin es clave en la
Introduccin 17
aplicacin de la metodologa Monte Carlo para la estimacin de probabilidades.
Ntese que aunque los desarrollos precedentes se han hecho para el caso de que X
sea una variable aleatoria continua, los mismos son inmediatamente generalizables
al caso de que X sea discreta sin ms que sustituir las integrales por sumas, hacien-
do que f (x) pase a ser la funcin de probabilidad de X en lugar de su funcin de
densidad.
Ntese tambin que las expresiones anteriores son fcilmente generalizables al ca-
so de que X sea una variable aleatoria multidimensional en ese caso se represen-
tara por X. En efecto, las integrales simples seran ahora mltiples y la funcin
indicadora, ahora representada por
S
(x), sera multivariable. No se enuncian las
expresiones resultantes por brevedad y por resultar obvias a nuestro juicio.
Estas ideas simples tienen una aplicacin inmediata en el campo cientfico. Supn-
gase que se desea calcular la integral
a %
I
1
0
g(x) dx, [1.9]
siendo g(x) una funcin de la que se va a suponer que no tiene primitiva expresa-
ble analticamente, lo que hace que a no sea calculable por mtodos analticos
en particular por la regla de Barrow. El camino tradicional seguido en tales
casos es el de utilizar algn mtodo de integracin numrica para calcular a con
una precisin prefijada. Muchos son los mtodos competidores, pudindose men-
cionar entre otros la aproximacin de Riemann, la regla del trapecio o de Simp-
son, el procedimiento de Newton-Cotes, el mtodo de Romberg, etc. Se trata en
todos los casos de mtodos deterministas aplicados a un problema de enunciado
puramente determinista como es [1.9].
Sin embargo, a pesar de que el sistema real es determinista y de que los mejores
procedimientos de resolucin de [1.9] son tambin en este caso los del anlisis
numrico de base determinista, es posible construir un modelo de simula-
cin de base estocstica que permita estimar a mediante la metodologa Monte
Carlo.
Considrese al efecto la variable aleatoria auxiliar XzUVUnif (0 ; 1) distribuida
uniformemente en el intervalo [0; 1]. La funcin de densidad en dicho caso es:
f (x) %
E
0 ; x m0,
1 ; 0ax m1,
0 ; 1ax.
[1.10]
Eso hace que se pueda interpretar [1.9], es decir la integral a calcular, como la
esperanza matemtica de g(X), siendo X una variable aleatoria uniforme en el
intervalo [0 ; 1]:
a %E[g(X)], [1.11]
XVUnif (0; 1). [1.12]
La Figura 1.3 muestra el modelo de simulacin sugerido para estimar el parme-
tro del sistema real a mediante la metodologa Monte Carlo.
Figura 1.3. Modelo de simulacin sugerido para calcular [1.9].
Se generara un nmero m elevado de extracciones aleatorias e independientes de
la distribucin Unif (0; 1) en el siguiente epgrafe se ver cmo hacerlo, de-
signadas por x
1
, x
2
, ..., x
m
, se evaluara la funcin g(x) para cada uno de esos valo-
res y se obtendra la estimacin Monte Carlo de a mediante:
a4
m
%
1
m
m
;
i%1
g(x
i
). [1.13]
Ntese que si g( ) es integrable en [0; 1], entonces por la ley fuerte de los gran-
des nmeros se obtiene el importante resultado de que a4
m
tiende a a con probabi-
lidad 1 cuando m tiende a .
Si adems el cuadrado de g(x) es integrable en [0; 1] y se define,
p
2
g
%var [g(X)] %
I
1
0
[g(x) .a]
2
dx, [1.14]
entonces el error de estimacin a4
m
.a se distribuye, por el teorema central del
lmite, aproximadamente normal con media cero y varianza p
2
g
/m, mejorando
la aproximacin a medida que aumenta m.
Introduccin 19
Las dos propiedades referidas pueden expresarse formalmente as:
lm
mr
a4
m
%a, con probabilidad 1, [1.15]
m(a4
m
.a) N(0; p
2
g
) en distribucin. [1.16]
En particular, este ltimo resultado muestra que el trmino de error, a4
m
.a, tiene
un error tpico desviacin tpica de a4
m
.a igual a p
g
/m que va hacindose
ms y ms pequeo a medida que aumenta m. As pues, la velocidad de conver-
gencia de a4
m
hacia a est gobernada por la potencia m
.1/2
, que es caracterstica
del mtodo de Monte Carlo y que es independiente de la dimensin de la variable
aleatoria X sera la misma velocidad si el problema planteado fuera el clculo de
una integral triple, por ejemplo. Esto mismo tambin se expresa diciendo que la
aproximacin es de orden m
.1/2
, O(m
.1/2
).
Ntese que eso significa que si se desea aumentar al doble la precisin en la esti-
macin de a, ser necesario multiplicar por cuatro el nmero de puntos muestrea-
dos o lo que es igual, el nmero de variables aleatorias uniformes generadas.
An ms, si se desea ampliar en un dgito significativo la precisin del resultado
habr que multiplicar por 100 el nmero de puntos muestreados.
Esas modestas prestaciones en lo que se refiere a velocidad de convergencia son
caractersticas de la metodologa Monte Carlo. De hecho cualquier mtodo de
integracin numrica de los mencionados anteriormente supera con creces en efi-
cacia al mtodo de Monte Carlo como procedimiento de integracin para la reso-
lucin del problema propuesto, que es unidimensional. Sin embargo las cosas
cambian si aumenta la dimensin de la integral, pues el mtodo de Monte Carlo
no ve afectada su velocidad de convergencia, mientras que en los mtodos num-
ricos se ve perjudicada drsticamente. Y en los modelos de simulacin habituales
la dimensin de la integral puede ser importante. Adems, la metodologa Monte
Carlo tiene una raz estocstica tan evidente que la hace preferible en los modelos
con componente estocstico, aunque en muchos casos tambin podra aplicarse
en los mtodos de integracin numricos deterministas.
De vuelta a los resultados [1.15] y [1.16], especialmente a este ltimo, ntese que
no pueden ser aplicados directamente para la construccin de intervalos de con-
fianza para a, porque p
g
no es conocida a priori vase por [1.14] que su cl-
culo precisa de a, que es precisamente la cantidad a estimar por ser desconocida.
Este inconveniente se soslaya en parte al calcular
s
g
%
J
1
m.1
m
;
i%1
[g(x
i
) .a4
m
]
2
, [1.17]
para lo que slo es necesario utilizar resultados del modelo de simulacin. Con
ayuda de s
g
se puede establecer un intervalo de confianza de nivel 100(1 .d)%
para a. Dicho intervalo, que tiene el carcter de aproximado, es a4
m
uz
d/2
s
g
/m,
pues al ser m un nmero elevado en las aplicaciones de los modelos de simulacin
est justificado utilizar el cuantil z
d/2
de la N(0; 1). Se puede as poner,
Pr
A
a4
m
.z
d/2
s
g
m
ma ma4
m
!z
d/2
s
g
m
B
^1 .d , [1.18]
de modo que la estimacin puntual a4
m
de la cantidad a queda enriquecida al ser
acompaada de acotaciones del tipo [1.18], o al menos del error tpico s
g
/m,
que informan del grado de precisin de la estimacin a4
m
.
Todos los resultados que se acaban de exponer provienen de la discusin y resolu-
cin de la integral [1.9] pero son mucho ms generales de lo que pudiera supo-
nerse por estar ligados a un enunciado tan especfico. Y ello a pesar de que el
enunciado estaba preparado para que los lmites de la integral coincidieran con los
de la distribucin uniforme auxiliar, de modo que dicha integral pudiera ser direc-
tamente identificada con una esperanza matemtica.
No obstante, el hecho de que los lmites de la integral sean diferentes no supone
un problema serio. Si se desea calcular la integral
a %
I
b
a
h(y) dy, [1.19]
se puede utilizar el cambio de variable y %a !(b .a)x, con dy %(b .a) dx, y
disponer la integral [1.19] en la forma,
a %(b .a)
I
1
0
h[a!(b .a)x] dx %
I
1
0
g(x) dx, [1.20]
con g(x) %(b .a)h[a!(b .a)x]. Esta integral coincide con [1.9], lo que hace
aplicable inmediamente la metodologa de Monte Carlo para su resolucin. Incluso
Introduccin 21
si alguno de los lmites no es finito existe una transformacin adecuada para utili-
zar los resultados anteriores. Sea por ejemplo la integral
a %
I
0
t(y) dy, [1.21]
y considrese el cambio de variable y%1/(1!x), para el que dy %[.1/(1!x)
2
] dx.
Ahora se puede poner
a %
I
1
0
t
A
1
1 !xB
dx
(1!x)
2
%
I
1
0
g(x) dx, [1.22]
con g(x) %t[1/(1!x)]/(1!x)
2
y aplicar los resultados precedentes.
Otro cambio de variable que produce resultados anlogos es y %.ln(1.x), con
dy %dx/(1.x). Aplicando esta transformacin a [1.21] se llega a [1.9], siendo
en este caso g(x) %t[.ln(1.x)]/(1.x).
Cuando la integral es del tipo
a %
I
a
t( y) dy, [1.23]
el cambio apropiado es y %a .ln(1.x), con dy %dx/(1 .x). La integral
[1.23] se transforma de nuevo en [1.9], con g(x) %t[a.ln(1.x)]/(1.x).
Las integrales cuyo lmite inferior es .y el lmite superior b, como
a %
I
b
.
m(y) dy, [1.24]
se transforman fcilmente en integrales del tipo [1.9] mediante el cambio de varia-
ble y %b !ln(x) con dy %dx/x. Es claro que en tal caso la funcin g(x) de [1.9]
sera g(x) %m[b !ln (x)]/x.
Por ltimo, las integrales del tipo
a %
I
.
n(y) dy [1.25]
se pueden transformar en integrales del tipo [1.9] mediante el cambio de variable
y %ln(x) .ln (1.x) %ln[x/(1.x)]. Para este cambio de variable se verifica
que dy %dx/[x(1.x)] %dx/(x .x
2
) y g(x) %n[ln [x/(1 .x)]]/(x.x
2
).
Como ha podido comprobarse, la mayor parte de las integrales definidas simples
pueden resolverse mediante simulacin de Monte Carlo a partir de extracciones
de la variable aleatoria uniforme Unif (0; 1). La situacin es bastante ms comple-
ja si se trata de una integral mltiple con dimensin d b1, pues el cambio de va-
riables que transforma el recinto S en que se extiende la integral
a %
I I
I
S
g(x
1
, x
2
, ..., x
d
) dx
1
dx
2
dx
d
, [1.26]
en el hipercubo [0; 1]
d
, puede ser muy complejo o no existir. En realidad dicho
cambio de variables no es necesario si se dispone de algn procedimiento para ge-
nerar extracciones uniformemente distribuidas en el subconjunto S del soporte D,
S D. Esa tarea puede ser tan compleja como la de encontrar el cambio de varia-
bles que transforme S en [0; 1]
d
y que permita simplificar el proceso de extraccin
de las variables aleatorias uniformes pues todas ellas pasan a ser Unif
d
[0 ; 1], es
decir uniformes multivariantes de dimensin d.
No se piense sin embargo que la metodologa Monte Carlo exige ineludiblemente
la generacin de variables aleatorias uniformes. Eso ha sido as en el ejemplo intro-
ductorio de clculo de la integral [1.9]. Pero ni la metodologa Monte Carlo se
aplica exclusivamente al clculo de integrales, ni el clculo de stas tiene por que
ser conducido siempre de la manera en que ha sido expuesto.
En muchas ocasiones los modelos de simulacin (vase la Figura 1.2) contienen
entradas estocsticas que son variables aleatorias con distribucin de probabilidad
cualquiera: normal o gaussiana, exponencial, logstica, etc. En estas circunstancias
es necesario disponer de algoritmos para generar tales tipos de distribuciones. Cu-
riosamente tales algoritmos utilizan como materia prima extracciones de variables
aleatorias uniformes para transformarlas a continuacin en extracciones de las dis-
tribuciones deseadas, como si inevitablemente siempre hubiera que recurrir a la
distribucin uniforme lo cual es cierto, por otra parte.
En otras ocasiones, aunque un determinado problema pueda resolverse haciendo
uso exclusivo de la distribucin uniforme, como por ejemplo las integrales [1.9] y
[1.26], puede ser interesante muestrear de una distribucin auxiliar h(x) diferente
de la uniforme con el objeto de mejorar la precisin de la estimacin de Monte
Carlo para un tamao muestral dado. Esta es la idea del llamado muestreo por im-
portancia, que busca disminuir la varianza del error de la estimacin Monte Carlo
concentrando el muestreo en zonas de importancia en relacin con la estima-
Introduccin 23
cin. Para fijar ideas se comentar a continuacin la aplicacin del muestreo por
importancia al clculo de integrales.
Supngase que se quiere estimar como antes la integral [1.9]. Si la funcin g(x)
difiere mucho de la funcin de densidad de la distribucin uniforme en forma,
no en altura o valor entonces var [g(x)] dado por [1.14] toma un valor elevado,
incidiendo negativamente en la precisin de la estimacin a4
m
. La Figura 1.4 es til
para entender que el hecho de que el muestreo se lleve a cabo en la distribucin
uniforme tiene una relacin directa en la varianza de g(x) y por tanto en la preci-
sin de la estimacin. Se ha elegido una funcin g(x) particular marcadamente de-
creciente en el intervalo (0; 1). Ntese que a representa a la vez el rea bajo la
curva g(x) en el intervalo (0 ; 1) y el valor medio de g(x) en dicho intervalo por ser
de ancho unidad.
Figura 1.4. Representacin conjunta de la funcin g(x) y de la distribucin
uniforme, f (x) %1, 0mx m1, que intervienen en la integral [1.9].
Esta ltima es la razn por la que a aparezca representado en la Figura 1.4 como
una ordenada que, aunque desconocida por hiptesis, existe, y su inclusin es til
porque facilita la exposicin. Es evidente que la mayor parte del rea que represen-
ta a se encuentra en la parte ms a la izquierda del intervalo (0; 1), donde las orde-
nadas de g(x) son altas, mientras que una parte pequea de dicha rea se encuen-
tra en la zona de la derecha del intervalo (0 ; 1) por la razn contraria. Eso
significa que cuando una extraccin aleatoria de la Unif (0; 1) ha ocurrido en una
parte de la izquierda del intervalo (0; 1) la contribucin de dicha extraccin al
rea estimada a4
m
, medida por g(x
i
)/m segn [1.13], tiende a sobrevalorar la con-
tribucin media, y que la contribucin de dicha extraccin a s
2
g
vase [1.17]
tiende a ser muy alta. De forma parecida, cuando una extraccin aleatoria de la
Unif (0 ; 1) tiene lugar en la parte derecha del intervalo (0 ; 1), la contribucin de
dicha extraccin al rea estimada a4
m
tiende a infravalorar la contribucin media
pero a aumentar el valor de s
2
g
.
Si el muestreo se hubiera concentrado en los aledaos de x
0
(vase la Figura 1.4)
las cosas hubieran ido mejor, pues al ser prximos a a los valores g(x
i
) corres-
pondientes a las extracciones realizadas, sus contribuciones individuales a a4
m
ha-
bran estado cerca de la media, a4
m
/m, y la contribucin de g(x
i
) a s
2
g
habra sido
pequea. Sin embargo tal tipo de muestreo privilegiado, o muestreo por importan-
cia no puede darse utilizando la distribucin uniforme, que tender a repartir uni-
formemente, como es lgico, el conjunto de todas las extracciones en el intervalo
(0; 1). Pero existe, afortunadamente, una manera indirecta de llevar a cabo ese
muestreo por importancia, que consiste en ponderar de manera diferente las con-
tribuciones de g(x
i
) en a4
m
y en s
2
g
. Esa ponderacin distinta de la cuota uniforme
1/m se puede llevar a cabo utilizando otra mtrica de probabilidad en [1.9] dife-
rente de la uniforme. El cambio de mtrica no es especialmente difcil como se
ver a continuacin.
El desarrollo siguiente se realiza partiendo de la expresin [1.3] que permite ha-
cerlo ms general prcticamente sin esfuerzo adicional. nicamente se necesita
aclarar que la esperanza matemtica es un operador que utiliza una determinada
mtrica de probabilidad, la de la distribucin cuya funcin de densidad interviene
en el clculo de dicha esperanza. En la expresin [1.3] la mtrica viene inducida
por f (x) y tal vez hubiera sido ms adecuado expresar dicha integral en la forma
a %E
f
[g(X)] %
I
D
g(x)f (x) dx. [1.27]
Si no se hizo as y en general no se hace as, es porque el contexto suele dejar
perfectamente clara la mtrica que se utiliza en el clculo de la esperanza matem-
tica por lo que resulta en general innecesario reflejarla en el operador esperanza,
como se ha hecho en [1.27] disponiendo como subndice del operador el smbolo
de la funcin de densidad con la que se integra.
Como el mtodo del muestreo por importancia utiliza diferentes mtricas para el
clculo de esperanzas matemticas, conviene utilizar el criterio de nomenclatura
expresado en [1.27] por ser ms informativo.
Introduccin 25
Sea ahora h(x) una funcin de densidad auxiliar, cuyo soporte se va a designar por
H, de modo que DH, es decir que el soporte D de f(x) queda incluido en H
o, lo que es igual, que f (x) b0 implica que h(x) b0 para todo x. Esta exigencia
tambin implica que h(x) b0 para x D, de modo que la siguiente transforma-
cin en [1.27] es vlida:
a %E
f
[g(X)] %
I
D
C
g(x)f (x)
h(x) D
h(x) dx. [1.28]
En esta ltima integral h(x) ha sustituido a f (x) como mtrica de probabilidad, y si
no fuera porque la integral est extendida al conjunto D, diferente de H que es el
soporte de h(x), parecera que representa la esperanza matemtica de la funcin
que integra el corchete bajo la mtrica h(x). La esperanza matemtica aludida en
esta ltima frase es en realidad
E
h
C
g(x)f (x)
h(x) D
%
I
H
C
g(x) f (x)
h(x) D
h(x) dx, [1.29]
extendida al conjunto H, soporte de h(x). El hecho de que los conjuntos D y H
puedan ser diferentes recurdese que DH hace pensar que las integrales de
las expresiones [1.28] y [1.29] tienen un valor diferente. Esa primera impresin es
sin embargo apresurada. En efecto, al partir H en la unin de conjuntos disjuntos
H%D(H.D) %D(HD1), la integral [1.29] puede descomponerse en la
suma
I
H
C
g(x) f (x)
h(x) D
h(x)dx %
I
D
C
g(x) f (x)
h(x) D
h(x)dx !
I
HD1
C
g(x)f (x)
h(x) D
h(x)dx, [1.30]
y si se observa que por ser D el soporte de f (x) debe ser necesariamente f (x) %0
para x D1 y por tanto para x HD1, se concluye que la ltima integral de este
desarrollo es nula, por lo que se obtiene:
a %E
f
[g(X)] %
I
D
C
g(x)f (x)
h(x) D
h(x) dx %E
h
C
g(x) f (x)
h(x) D
. [1.31]
Este resultado es la clave del procedimiento de reduccin de varianza denominado
muestreo por importancia. Establece que la integral a es a la vez la esperanza ma-
temtica de g(X) calculada con la mtrica f (x) y la esperanza matemtica de
g(X)f (X)/h(X) calculada con la mtrica h(x).
Si se designan por x
f1
, x
f2
, ..., x
fm
ciertas extracciones aleatorias e independientes
de la distribucin f (x), y por x
h1
, x
h2
, ..., x
hm
ciertas extracciones aleatorias e inde-
pendientes de la distribucin h(x), se pueden construir dos estimaciones diferen-
tes de a, que van a ser designadas por a4
f, m
y a4
h, m
:
a4
f, m
%
1
m
m
;
i%1
g(x
f i
), [1.32]
a4
h, m
%
1
m
m
;
i%1
C
f (x
hi
)
h(x
hi
)D
g(x
hi
). [1.33]
Estas dos estimaciones de Monte Carlo son realizaciones de estimadores centra-
dos en a por [1.31], pero la varianza del error de estimacin puede ser muy dife-
rente en uno y otro caso. Una eleccin adecuada de la distribucin auxiliar h(x)
puede hacer que la varianza del error de estimacin a4
h, m
.a sea sensiblemente
inferior a la varianza del error de estimacin a4
f, m
.a. Para ello es conveniente que
la densidad h(x) sea prxima al producto de g(x) f (x) por una constante de pro-
porcionalidad que no es necesario determinar. En tal caso los trminos del
sumatorio [1.33] sern prximos a esa constante de proporcionalidad aludida y
como consecuencia la varianza de f (x)g(x)/h(x) ser pequea. Ntese que en el
caso particular de que h(x) f (x)g(x) todos los trminos de [1.33] seran cons-
tantes y la varianza nula. Sin embargo en este caso la constante de proporcionali-
dad que al ser aplicada al producto f (x)g(x) la hace coincidir con h(x) es 1/a, el
inverso de la integral a calcular, de modo que esa eleccin tan precisa de h(x)
cuando es posible es equivalente al clculo de la integral solicitada y no es
necesario continuar con ningn tipo de muestreo. Ni que decir tiene que una
eleccin desafortunada de h(x) puede conducir a un resultado distinto del desea-
do: que la varianza de a4
h, m
.a sea superior a la de a4
f, m
.a.
En el caso particular de que f (x) sea la funcin de densidad de la distribucin uni-
forme Unif (0; 1), la integral [1.27] coincide con [1.9] pues f (x) %1 para
0ax m1 y f (x) %0 para x fuera del intervalo (0 ; 1]. En ese caso las extracciones
x
fi
de la expresin [1.32] son uniformes Unif (0; 1). Ntese que la expresin
[1.33] en tal caso no puede simplificarse sustituyendo f (x
hi
) por la unidad, pues
esto sucede slo en el caso de que 0 ax
hi
m1, pero como el soporte H de h(x)
puede contener valores de x
hi
fuera del intervalo (0; 1], en tales casos ser
f (x
hi
) %0, por lo que f (x
hi
) debe permanecer como tal en [1.33] a pesar de que
f (x) sea la distribucin uniforme. Slo cuando el soporte H de h(x) coincida con
Introduccin 27
el intervalo (0; 1] ser posible simplificar la expresin [1.33] utilizando el hecho
de que en tal caso es f (x
hi
) %1.
Al comparar las expresiones [1.32] y [1.33] se observa que el muestreo por im-
portancia es equivalente a calcular a4
h, m
ponderando los valores g(x
hi
) con los pe-
sos f (x
hi
)/mh(x
hi
). Algunos de estos pesos pueden ser cero cuando x
hi
D1 y
otros en cambio relativamente elevados, siendo en tal caso x
hi
extracciones impor-
tantes por su contribucin al clculo de a. Ntese que a pesar de la apariencia de
[1.33], a4
h, m
no ser en general una media ponderada de los valores g(x
hi
), y ello
porque los pesos de las diferentes observaciones g(x
hi
) no tienen por qu sumar la
unidad.
Un caso de gran importancia es el de la integral [1.6] que identifica la probabili-
dad de un suceso con la esperanza matemtica de la funcin indicadora de dicho
suceso. Comparando [1.6] y [1.27] se deduce que en este caso es g(x) %
s
(x), de
modo que la eleccin ideal de h(x), que coincide con el producto g(x)f (x) dividi-
do por el valor de la integral, resulta ser
h(x)
ideal
%
g(x)f (x)
a
%
s
(x)f (x)
Pr (X S)
%f (x 8 S), [1.34]
es decir la funcin de densidad de X condicionada por el suceso X S. Una elec-
cin de h(x) lo ms prxima que se pueda a f (x 8 S) provocar una disminucin
notable de la varianza del error de estimacin.
El muestreo por importancia pone de manifiesto que en muchos casos ser conve-
niente muestrear de distribuciones h(x) cualesquiera y no slo de la distribucin
uniforme. No obstante, el muestreo de la distribucin uniforme es muy importan-
te la en simulacin de Monte Carlo, tanto porque es la base de la resolucin de
algunos problemas tpicos de la metodologa Monte Carlo como la integracin
y la optimizacin de funciones como por ser un paso previo para la generacin
de otro tipo de variables aleatorias, en tanto que los algoritmos ideados para llevar
a cabo esa generacin se apoyan siempre en la extraccin de variables aleatorias
uniformemente distribuidas.
La importancia que tiene el muestreo de la distribucin uniforme en la simulacin
estadstica hace aconsejable que se le dedique un epgrafe, aunque el estudio del
mismo se puede omitir sin prdida importante de continuidad. Si as se hace, se
puede pasar directamente al captulo 3 dando por hecho que los ordenadores son
capaces de generar secuencias de nmeros aleatorios en realidad pseudoalea-
torios del tipo U
1
, U
2
, ..., U
i
, que se comportan como extracciones indepen-
dientes de la distribucin uniforme Unif (0 ; 1). En Excel
TM
, por ejemplo, cada
vez que se ejecuta la funcin ALEATORIO( ) la mquina devuelve un nmero
aproximadamente aleatorio de la secuencia referida.
Introduccin 29
La intencin de este libro es hacer que la auditora sea algo positivo, plantear un enfoque participativo
sobre el terreno, ayudar a controlar las emociones que suscita, etc.
Esta nueva obra de Genievive Krebs es una recopilacin real de situaciones vividas a lo largo de las
auditoras donde la autora comparte su experiencia respondiendo a las preguntas planteadas con mayor
frecuencia tanto por los auditores como por los auditados:
Cmo puedo ser innovador durante la auditora?
Qu lac cuarcc rc le tericc tierc su|cierte ara rearar ri aucitcria!
Cmo reacciono cuando no se alcanza el consenso en la reunin de cierre?
Cmo hago una auditora cuando apenas conozco la actividad en cuestin?
Cmo reacciono ante la falta de implicacin de la direccin?
Ccrc a|rcrtc ue lcs aucitaccs rc se irliuer er la lari|cacicr ce la calicac!
Qu lac ara rare|ar ur ccr|ictc ertre ccs aucitaccs!
Nc terc la su|cierte artiuecac er la erresa. Ccrc re rearc!
!erc crer a la erresa er ci|cultaces. Qu cebc lacer!
Tengo miedo de que se audite al estudiante en prcticas y nos ponga en un aprieto. Qu debo hacer?
No me caen bien los auditores que vienen de la central, de la sede principal. Qu puedo hacer?
Comprendiendo lo que ellos mismos sienten, tanto los auditores como los auditados podrn contro-
lar mejor las exigencias de su misin.
Genevive Krebs
Profesora de coaching en el Institut Franais de lcoute et du Management de Pars, Genevive Krebs se ha
especializado en el desarrollo de herramientas personalizadas para la atencin al cliente y la relacin cliente-
proveedor dentro de la empresa.
Su experiencia en el campo de la auditora se desarrolla en el rea de las auditoras de direccin, auditoras de
cultura de cliente interno y externo, auditoras de recepcin y de servicio especial aportado al cliente. Desde
la llegada de las normas ISO 9001 versin 2000, tambin est especializada en la evolucin hacia el cambio, la
responsabilidad de la direccin en la cultura de la gestin de la calidad, y en el concepto de mejora continua.
IsSN:978-84-8145-552-0
Juan Carlos Lpez Ag es Doctor Ingeniero
de Caminos, Canales y Puertos y Licenciado en
Ciencias Econmicas y Empresariales. Es profe-
sor en la Universidad Politcnica de Madrid y
ponente y autor de numerosos artculos, libros
y publicaciones. Dentro del entorno de AENOR,
es Presidente del comit AEN/CTN 80 y miem-
bro de la Comisin Permanente. Actualmente
es Presidente del Comit Europeo de Norma-
lizacin (CEN), Director General del Instituto
Espaol del Cemento y sus Aplicaciones (IECA),
Vicepresidente del Consejo de la Asociacin
Cienli|ccecnica del crmicn Lslruclu
ral (/CL) y Presidente del Grupo de Trabajo
Estadstica aplicada al hormign estructural
(/CL).
El cometido de esta publicacin es analizar el mto-
do de Monte Carlo como herramienta de muestreo
arli|cial. 0ichc melcdc ha sidc ulili/adc exlensa
menle para validar lcs crilerics de cerli|cacicn de
muchos productos del sector de la construccin. El
autor ofrece la revisin de algunos de los procedi-
mientos ms sencillos utilizados como herramientas
prcticas para el anlisis de datos mediante hojas de
calculc de Lxcel
TM
.
Uno de sus objetivos concretos es la formalizacin
de la simulacin estadstica entendiendo como
simulacin la eneracicn de dalcs arli|ciales en un
ordenador en el rea de control de calidad y, en
especial, en el desarrollo de criterios de aceptacin
de materiales. Juan Carlos Lpez Ag se adentra, con
una propuesta personal, en el fascinante terreno de
la simulacin de la distribucin gaussiana o normal.
Adems, el lector encontrar una mencin especial a
la simulacin de los estadsticos de orden ms cono-
cidos y de amplio uso en control de calidad.
Este es un ttulo recomendado para el conjunto de
profesionales relacionados con el control de calidad
de los materiales, aunque puede ser utilizado para
otras aplicaciones estadsticas que usan la simulacin
de Monte Carlo de modo general.

Guia Basica para La Simulacion de Monte Carlo PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Guia Basica para La Simulacion de Monte Carlo PDF

Caricato da

Copyright:

Formati disponibili

Juan Carlos Lpez Ag

Gua bsica para

ller, o mtodo polar . . . . . . . . . . . 88

Potrebbero piacerti anche