Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
=
=
M
i
i ik
C C E t
Donde ( ) R d k
i
= para cada i , y ( )
M
t t t ,... ,
1 0
representa la distribucin de
estado estable para los estados del sistema segn la poltica R que se evala.
Despus de obtener ( )
M
t t t ,... ,
1 0
segn cada una de las cuatro polticas (esto se
puede hacer con el OR Courseware) el clculo de ( ) C E se resume en la siguiente
tabla.
Poltica
( )
3 2 1 0
, , , t t t t ( ) C E en miles de dlares
a
R
|
.
|
\
|
13
2
,
13
2
,
13
7
,
13
2
( ) ( ) ( ) ( ) | | 1923 $
13
25
6 2 3 2 1 7 0 2
13
1
= = + + +
b
R |
.
|
\
|
21
2
,
21
2
,
7
5
,
21
2
( ) ( ) ( ) ( ) | | imo min 1667 $
21
35
6 2 4 2 1 15 0 2
21
1
= = + + +
c
R |
.
|
\
|
11
1
,
11
1
,
11
7
,
11
2
( ) ( ) ( ) ( ) | | 1727 $
11
19
6 1 6 1 1 7 0 2
11
1
= = + + +
d
R
|
.
|
\
|
32
1
,
32
1
,
16
7
,
2
1
( ) ( ) ( ) ( ) | | 3000 $
32
96
6 1 6 1 6 14 0 16
32
1
= = + + +
As, la poltica ptima es
b
R , es decir, reemplazar la maquina cuando se
encuentre en el estado 3 y hacer una reparacin general cuando se encuentre en el
estado 2. El costo esperado (a la larga) por semana es $1667.
En este pequeo ejemplo, es adecuado usar la enumeracin exhaustiva para
encontrar la poltica ptima, donde slo existen cuatro polticas relevantes. Sin
embargo, muchas aplicaciones tienen tantas polticas que este enfoque no es factible.
Para tales casos, se necesitan algoritmos que puedan encontrar una poltica ptima de
manera eficiente.