Sei sulla pagina 1di 33

Capítulo 2

MARCO TEORICO
En este capitulo se presenta las herramientas teóricas necesarias que posteriormente el
algoritmo de la prueba DE utilizará para calcular el valor P. Esto nos proporcionará un
acercamiento al principio de dicha prueba y su anterior elección.

2.1 DISEÑO EXPERIMENTAL

Como puntualiza Montgomery (1991) y otros autores, el experimento básicamente


consiste en una prueba o ensayo, donde se provoca un cambio, o una serie de cambios en
las condiciones de operación de un sistema o de un proceso con el propósito de extraer
información relevante. De ahí, un experimento diseñado, es un ensayo o una serie de
ensayos o de pruebas en las cuales se provocan cambios deliberados en las variables de
entrada del sistema, para así poder observar y eventualmente identificar las causas de los
cambios en la respuesta de salida. O como diría Gutiérrez y de la Vara (2003) consiste en
planear una serie de pruebas experimentales, para que de los datos generados sea posible un
análisis estadístico con el fin de obtener conclusiones válidas y sobre todo objetivas a
cerca del sistema o del proceso de estudio.

Los métodos de diseño de experimentos tienen dos cometidos importantes, por un


lado, el desarrollo de procesos y por el otro la depuración de los mismos. Cualquiera que
éste sea, se tiene que aprender algo acerca los procesos, es decir, se está generando
conocimiento, convirtiéndose en un ejercicio científico de aprendizaje. Ver Montgomery
(1991). Generalmente este conocimiento se adquiere experimentando para que de este

4
CAPÍTULO 2. MARCO TEÓRICO

modo se usa la información del experimento para establecer nueva s conjeturas o hipótesis,
que lleva a realizar nuevos experimentos y así sucesivamente.

Como se muestra en el modelo conceptual de un sistema, ver Fig. 2.1, existen


variables que el investigador puede controlar (factores controlables), algunas otras que son
no controlables (factores de ruido), sin olvidar claro, las más importantes los factores
estudiados. Con esto en mente Montgomery (1991) determina algunos objetivos básicos del
diseño experimental, estos son:

− Determinar las variables (x, z) que influyen de manera importante en la


respuesta Y
− Identificar el valor optimo de x que influye en Y, de modo que la respuesta Y
sea cercana al valor deseado.
− Dado que las variables z son no controlables, determinar los valores z que
influyen en Y para minimizar los efectos de dichas variables no controlables.

x1 x2 . . . xn

Proceso
Entrada Y

z1 z2 . . . zn

Fig. 2.1

La elección de un diseño depende tanto de la hipótesis en vigor que permita obtener


respuestas lo menos ambiguas y lo menos afectadas por los errores experimentales, como el
adecuado análisis de los datos, que indique lo que puede concluirse de manera razonable de
la hipótesis que se prueba y de pie a nuevos ideas a considerar. De manera que el diseño
elegido explo re zonas que en su conocimiento, signifique un avance importante en el
entendimiento actual del problema como diría Rivera (2003).

5
CAPÍTULO 2. MARCO TEÓRICO

2.2 ANALISIS DE VARIANZA

Con el objetivo de hacer afirmaciones válidas a cerca del proceso o del sistema, que a partir
de ahora denominaremos también población, únicamente en base a las observaciones o
muestras, se emplean métodos de inferencia estadística, como es el caso del Análisis de
Varianza

Una practica común en el investigador, es la de analizar la información extraída de


los diseños experimentales mediante un Análisis de Varianza o ANOVA, la cuál
constituye un método simple para la obtención del cuadrado medio del error a partir de las
muestras obtenidas de la población, de vital importancia para la prueba DE ver Burguete,
Tamborero y Morales (2003) y poder inferir los parámetros que la describen.

En el ANOVA, las fuentes de variación pueden ser arregladas en un experimento


cuyo objetivo es probar las hipótesis apropiadas con respecto a los tratamientos y hacer una
estimación, para que se pueda concluir sobre cuales factores recaen las variaciones en la
variable de respuesta observada, es decir, que genera la variabilidad en cada observación.

Es preciso puntualizar que existe una diferencia entre las observaciones


individuales, dicha discrepancia, o fluctuación, se le denomina error experimental. Dicho
error aleatorio, es producto de una variación no controlable, no explicable e inevitable. Es
así como debemos hablar de la variable de respuesta, como una variable aleatoria y que
existe una función con ciertos parámetros precisos que la describe. Cabe señalar que el
ANOVA supone que los errores aleatorios son independientes que siguen un distribución
normal con media 0 y varianza común σ 2 , ver Montgomery (1991).

De tal modo que cada observación se puede describir mediante el modelo


estadístico lineal de la siguiente forma:

Y ij = µ + τ i + ε ij i = 1,..., a; j = 1,..., b

6
CAPÍTULO 2. MARCO TEÓRICO

donde:

Y ij = observación j del tratamiento i.

µ = media general del experimento.


ιi = efecto del tratamiento i.

ε ij = errores aleatorios independientes con distribución N ( 0, σ 2 ) .

Este tipo de arreglo se le conoce como Diseño experimental, ya que se inves tigan
los efectos de diferentes niveles o magnitudes de un solo factor, ver tabla 2.1 que se
presenta a continuación. Un ejemplo completo de análisis de varianza de expondrá en la
siguiente sección para el modelo bloques al azar.

Tratamiento Observaciones Totales Promedios


(Nivel)
1 Y11 Y12 ... Y1b Y1 . Y 1.
. Y21 Y22 ... Y2b Y2. Y2.
.
a Y a1 Ya2 ... Y ab Ya. Y a.

Y.. Y..

Tabla 2.1

2.2.1 MODELO BLOQUES AL AZAR

En este modelo, las observaciones, dígase unidades experimentales, se agrupan en bloques


según los niveles de la fuente de variación en forma tal que la variabilidad de los datos
provenientes de fuentes extrañas pueda ser controlada adecuadamente. Así mismo, los
tratamientos son distribuidos al azar dentro de cada uno de los bloques. La variabilidad
entre bloques debe ser significativa, para que el diseño se reduzca al error experimental, de
donde.

Y ij = µ + τ i + β j + ε ij i = 1,..., a; j = 1,..., b

7
CAPÍTULO 2. MARCO TEÓRICO

Y donde:
Yij = observación j del tratamiento i
µ = media general del experimento
ιi = efecto del tratamiento i.

β j = efecto bloque j.

ε ij = errores aleatorios independientes con distribución N ( 0, σ 2 ) .

Y para el Análisis de Varianza se calculan:

SCTRA SCBLOQ
(a − 1) (b − 1)
FcTRAT = , FcBLOQUES =
SCerror SCerror
G.L.error G.L.error

Donde:

a
Yi • 2 Y • • 2
SC Tratamient os = ∑ b

ab
i =1

b
Y • j2 Y ••2
SC Bloques = ∑ −
j =1 a ab
a b
Y • •2
SCTotales = ∑∑ Yij 2 −
i =1 j =1 ab

SC Error = SC Totales − SC tratamientos − SC Bloques

Para ilustrar el análisis de varianza suponga el siguiente ejemplo tomado de


Montgomery (1991) y expuesto en la tabla 2.2, donde se recolectan los datos para el
tamaño de grano de diferentes lingotes producidos en cuatro diferentes hornos a cuatro
diferentes velocidades de agitación, como los hornos son fuentes de variación se utiliza el
modelo bloques al azar.

8
CAPÍTULO 2. MARCO TEÓRICO

Velocidad de agitación (rpm)

Horno 5 10 15 20 Y.j medias


1 8 14 14 17 53 13.25
2 4 5 6 9 24 6.00
3 5 6 9 3 23 5.75
4 6 9 2 6 23 5.75
Yi. 23 34 31 35 123
medias 5.75 8.50 7.75 8.75
media general 7.69
Tabla 2.2

Aplicando el análisis de varianza a este experimento, se obtienen los resultados


abajo descritos en la tabla 2.3:

Análisis de Varianza
F.V. SC GL CM Fc

Tratamientos 22.19 3 7.40 0.85


Bloques 165.19 3 55.0625
Error 78.06 9 8.67
Total 265.44 15

Tabla 2.3

Si comparamos Fc de la tabla 2.3, contra un nivel de significación α=0.05, es

decir, F0.5 , 3, 9 =3.86. Se tiene Fc < Fα , por lo tanto no hay efecto debido a la velocidad de

agitación en el tamaño del grano, es decir, no hay variación debida a los niveles del
tratamiento, se acepta la hipótesis de igualdad de los tratamientos. De este modo, como se
mencionó anteriormente, se analizan comúnmente los datos en un diseño de experimentos,
en la sección siguiente se expone a grandes rasgos lo problemas que dicho procedimiento
implica, recomendando la prueba DE como alternativa.

2.3 PRUEBA DE HIPÓTESIS Y LA PRUEBA F

La prueba de hipótesis es una técnica de inferencia estadística útil al investigador en su


afán de comparar dos ó más condiciones (o tratamientos) dadas que se han aplicado a un
sistema o a un proceso, ver Montgomery (1991). Es entonces que al investigador se le

9
CAPÍTULO 2. MARCO TEÓRICO

permite llevar a cabo una comparación sobre bases objetivas, con un conocimiento sobre
los riesgos asociados si se llegara a tomar una decisión equivocada.

Básicamente una hipótesis estadística, es una afirmación acerca de los parámetros


de una o varias poblaciones (procesos o sistemas) cuya asunción puede ser cierta o no , para
probar una hipótesis estadística, se debe contrastar con información extraída de las
muestras (observaciones) con el objeto de aceptarla o rechazarla, para ambas conclusiones
existe la posibilidad de cometer dos tipos de error.

La hipótesis que se desea probar con la intención de rechazarla se llama hipótesis


nula H 0 , rechazar la hipótesis nula implica aceptar una hipótesis alternativa H a .Los dos
tipos de error en los cuales podemos incurrir en la prueba de hipótesis son lo siguientes :

α= P(Error Tipo I )=P(Rechazar Ho / Ho cierta),

β=P(Error Tipo II)= P(Aceptar Ho / Ho es falsa) .

Y donde la potencia de la prueba es: Potencia = 1-β= P (rechazar Ho/ Ho es falsa).

Para tomar dicha decisión, se utiliza un estadístico de prueba, es decir se debe de


rechazar o no la hipótesis en vigor, a un nivel de significación establecido por el
investigador, como se hizo en el caso del ejemplo anterior para bloques al azar, sección
2.2.1. La función del estadístico es la de decidir a que sub-espacio paramétrico pertenece el
parámetro desconocido, y por consecuente inferido, de la población de la cual se realiza la
comparación. El subconjunto para el cual H 0 se rechaza se le denomina comúnmente
región crítica.

Dicho estadístico para el análisis de varianza, está basado en la función


distribución de probabilidad F. La distribución F originada a partir de dos funcio nes que se
distribuyen normales. Básicamente la prueba F en diseños experimentales se usa para
probar la igualdad de medias de los tratamientos. Pero como se ha demostrado por otros

10
CAPÍTULO 2. MARCO TEÓRICO

autores, la prueba F del ANOVA adolece de cualidades que se le han atribuido, ver
Burguete, Tamborero y Morales (2003). El trabajo aquí presentado, constituye una
alternativa al uso de la prueba F y poder incurrir en menos riesgos de tomar una decisión
inadecuada, en cuanto a bloques completamente al azar se refiere.

2.4 El VALOR P

Básicamente el valor P es el menor nivel de significación con el cual podemos rechazar la


hipótesis nula. El valor P en si es una probabilidad que se define en el ANOVA como el
área bajo la curva de la función densidad de probabilidad de F, en un punto que define un
valor Fc sobre el eje de las abscisas. Éste debe compararse con el valor nominal deseado α,

establecido por el observador que es igualmente un área que define un valor Fα sobre el
mismo eje.

Es así como se rechaza la hipótesis nula según caiga en la zona de no rechazo (Fig.
2.2) o de rechazo (Fig. 2.3) definido por Fα . La comparación se hace en base a la f.d.p. de
F donde compararemos dos valores, sea:

Región crítica o zona de rechazo


valor P
α
Valor P

Fc Fα
Se acepta Ho dado que P > α

Fig. 2.2

11
CAPÍTULO 2. MARCO TEÓRICO

Fig. 2.3

2.5 CONTRASTE

Los contrastes son comparaciones individuales de las medias de los tratamientos, esto
conlleva a realizar combinaciones lineales convexas entre los totales de los tratamientos,
que es el principio de un contraste, una combinación lineal. El objetivo es el de probar
atributos de los tratamientos, y por ende, cuales de ellos son significativos.

Si bien los contrastes forman parte de las pruebas de rango múltiple que sirven para
determinar que tratamientos son los que provocan las diferencias observadas, no todo
contraste es una PRM como aclara Burguete y Tamborero (2003). Las PRM se realizan
después de haber analizado los datos. Es decir una vez que se rechazaron las hipótesis
pertinentes.

Supóngase el modelo completamente al azar

Y ij = µ + τ i + ε ij i = 1,..., a; j = 1,..., b

Un contraste es una combinación lineal de totales de los tratamientos de la forma

a a

∑ Ciτ i = 0 , sujeto a
i =1
∑C
i =1
i =0.

12
CAPÍTULO 2. MARCO TEÓRICO

a a
Dos contrastes ∑ C iτ i = 0 y ∑Dτ i i = 0 son ortogonales si sus coeficie ntes {C i } y
i =1 i =1

a
{Di } se relacionan de la misma manera, ya sea ∑ C i Di =0
i =1

2.6 ESTADISTICOS DE ORDEN

En las pruebas de rango múltiple, donde comparamos los totales de los tratamientos
involucrados, en particular en la prueba de Student, en la prueba de Tukey, y
particularmente en la prueba de rango múltiple que se desarrolla en la presente tesis, es
decir, la prueba DE, los estadísticos de orden son fundamentales, como lo explica
Burguete, Tamborero y Morales (2003), debido a que es necesario ordenar dichos totales,
para poder hacer sus respectivas diferencias, dado que al tomar muestras aleatorias de
diferentes poblaciones por razón natural quedarán ordenadas. Sea de la definición de
Mood y Graybill (1972).

Sea X 1 , X 2 ,..., X n una muestra aleatoria de la función densidad de probabilidad f(x)

y Y1 , Y 2 ,..., Y n las mismas X i únicamente dispuestas en orden de magnitud creciente

Y1 < Y 2 < ... < Yn . De este modo las Y1 , Y 2 ,..., Y n son conocidas como los estadísticos de

orden de la muestra aleatoria X 1 , X 2 ,..., X n .

2.7 RANGO ESTUDENTIZADO

De la definición propuesta por Mood y Graybill (1972), se define X 1 , X 2 ,..., X n una

muestra aleatoria de tamaño n de una población normal(0,1), Y1 < Y 2 < ... < Y n los

estadísticos de orden de dicha muestra, y V 2 una variable chi-cuadrada con m grados de


libertad, suponiendo X y V 2 independientes entonces la variable q, se define como :

13
CAPÍTULO 2. MARCO TEÓRICO

Yn − Y i
q= ,
V/ m

conocido como rango o recorrido estudentizado. Indispensable en el desarrollo de la


prueba DE que en esta tesis se emplea, dado que se basa en la generalización de dicho
estadístico, pudiendo tener cualquier diferencia en términos de los estadísticos de orden, se
describirá más a detalle en el siguiente capitulo.

2.8 GENERADORES DE NUMEROS ALETORIOS

Como se verá en el capitulo siguiente, es nece sario producir números con ciertas
características, simularlos, una de ellas es la aleatoriedad, esta sección pretende poner al
tanto al lector sobre los métodos que se utilizan para generar dichos números. Y como se
explicará más adelante igualmente, la necesidad de hacerlo como único camino para poder
realizar la prueba DE, en el afán de comparar los dos tipos de modelos.

2.8.1 GENERADOR

La tarea de un algoritmo que genere números aleatorios como lo describe Neiderreiter

(1992), es la de dar una función de distribución F en ℜ , generando una secuencia de


números reales que simule un secuencia de variables aleatorias independiente e
idénticamente distribuidas, con una función de distribución F .

2.8.2 NÚMEROS ALEATORIOS ~ U (O, 1).

Los números aleatorios uniformes, son números aleatorios cuya función de distribución es
la uniforme U en el intervalo I = [0,1] ver DeGroot (1986), la función de distribución se
define como:

0 para t < 0 U(t) 


 
U (t ) = t para 0 ≤ t ≤ 1 
1 para t > 0 
 
1

0 t

14
CAPÍTULO 2. MARCO TEÓRICO

Sea su f.d.p.:

u(t)

0 1 t

0 para t < 0

u ( t ) =  1 para 0 ≤ t ≤ 1
 0 para t > 0

2.8.3 SECUENCIA EN LA GENERACIÓN DE NÚMEROS ALEATORIOS


DISTRIBUIDOS U (0,1).

Sea la definición: una secuencia x 0 , x1 ,... de números en I = [0,1] es completamente


distribuido uniforme, si para cada entero s≥1 la secuencia de puntos

( xn , xn+1 ,..., x n+ s−1 ) ∈ I s = [0,1] , n = 0,1…., es uniformemente distribuido en I s . Entre


otras, véase Niederreiter (1992).

2.8.4 ALGORITMO GENERADOR

Antes de exponer el algoritmo, cabe mencionar que los números aleatorios son generados
por secuencias determinísticas, basadas en procedimientos recursivos, y la producción de
estás es en última estancia periódica, nuevamente recurrimos a Niederreiter (1992) para tal
afirmación. De este modo realmente estamos generando pseudo números aleatorios (PRN)
que son relativamente fácil de producirse computacionalmente, con algunos parámetros de
entrada.

El método de generación de PRN uniformes que definiremos es el “linear


congruential method”. Como parámetros del método, tenemos que escoger un numero
entero positivo muy grande M, un entero a con 1 ≤ a < M, y finalmente un numero

15
CAPÍTULO 2. MARCO TEÓRICO

c ∈ Z M = {0,1,..., M − 1}. Así pues, se selecciona un valor inicial y0 ∈ Z M y entonces


generar una secuencia y0 , y1 ,... ∈ Z M por el método recursivo:

y n +1 ≡ ay n + c mod M para n = 0,1 ...

A partir de esta secuencia, se deriva el “congruential seudo random numbers”, sea:

∈ I = [0,1]
yn
xn = para n = 0, 1, ...
M
De esta manera se estarán generando números aleatorios distribuidos uniforme
(0,1), para ser precisos PRN uniformes.

2.8.5 TEOREMA DE FUNCION INVERSA Y LA GENERACION DE NÚMEROS


ALEATORIOS ~ N(0,1)

En el caso de los números aleatorios, se distinguen los seudo números aleatorios uniformes
de los no uniformes. Los PRN (Pseudo Random Numbers) no uniformes, usualmente se
generan a partir de los PRN que se distribuyen uniforme (0,1), para después ser
transformados en una función de distribución dada F ≠ U .

Para tal propósito, existen varios métodos, como son por mencionar algunos, el
método de rechazo, el método de composición, el método de ración de números uniformes,
aquí se expondrá solamente el método de la función inversa descrita en Niederreiter (1992)
para generar números aleatorios de cualquier distribución

De acuerdo al método, existe una función de distribución F que es estrictamente


creciente y continua en los ℜ . Entonces se asume que F tiene una función inversa F −1 y
que se define al menos en el intervalo (0,1). Ahora si se toma una secuencia x0 , x1 ,... de

números PRN que se distribuyen U (0,1) y define y n = F −1 ( x n ) , n = 0,1,..., de la secuencia


generadora. De este modo se obtienen números aleatorios que se distribuyen F.

16
CAPÍTULO 2. MARCO TEÓRICO

En vista de la imposibilidad de generar números que se distribuyan N(0.1) por


medio de la función inversa, se proporcionan dos diferentes algoritmos, el primero
generando dos números aleatorios U(0,1) y un segundo que utiliza el teorema del límite
central.

Sea la f.d.p de un número aleatorio que se distribuye N ( 0,1)

x2
1 −2
f ( x) = e -∞ < x < ∞ .

Si se define dicho número como yi = µ + Z σ , remplazando el valor de cada

parámetro característico de la normal tipificada, se tiene yi = Z i donde Z i es la variable


normal estándar. De este modo, aplicando el procedimiento descrito por Box y Muller,
ver Rubinstein (1981), tendremos dos números normales independientemente distribuidos
generados a partir de dos números aleatorios uniformes donde:

Z1 = (− 2 ln x1 ) 2 cos 2πx2
1

Z 2 = (− 2 ln x1 ) 2 sin 2πx 2
1

De este modo el algoritmo procedería de la siguiente manera:

1 Generar dos números aleatorios uniformes (0,1) x1 , x2 .

2 Calcular simultáneamente Z1 , Z 2

Ejemplo:

Sea el primer numero x1 = 0.124687 y el segundo x2 = 0.506689, se procede a


calcular Z1 , Z 2 .

17
CAPÍTULO 2. MARCO TEÓRICO

Z1 = (− 2 ln( 0.124687) ) 2 cos 2π ( 0.506689)


1

Z 2 = (− 2 ln( 0.124687) ) 2 sin 2π (0.506689)


1

Z1 = 1.027721
Z 2 = 0.113156

El siguiente algoritmo expuesto en Rubinstein (1981) se obtiene de manera más


natural al generar al menos doce PRN y utilizando el teorema del límite central, dado que
si la secuencia de PRN uniformes constituye una muestra aleatoria uniforme x0 , x1 ,..x n . , el
número :
n

∑x
i =1
i − nµ
yi = ,
nυ 2

tendrá E ( y i ) = µ y var( yi )= υ 2 cuando n es grande yi se distribuye aproximadamente


N(0,1).

Si particularmente generamos doce de estos números uniformes se distribuirán


1
normal con E ( y i ) = 1 / 2 y var ( y i )= , entonces:
12
n

∑x
i =1
i − n/ 2
yi = ,
n / 12

remplazando los parámetros correspondientes, se tiene:

12
yi = ∑x
i =1
i −6,

entonces el algoritmo generador de números N(0,1) es:

1 Generar doce números aleatorios U(0.1)


12
2 yi = ∑x
i =1
i −6

18
CAPÍTULO 2. MARCO TEÓRICO

Ejemplo:

Sean los siguientes seudo números aleatorios uniformes (0,1),

x1 = 0.124687
x2 = 0.506689
x3 = 0.623556
x3 = 0.403274
x4 = 0.156447
x5 = 0.763077
x6 = 0.868261
x7 = 0.816153
x8 = 0.649292
x9 = 0.027089
x10 = 0.577379
x11 = 0.573792
x12 = 0.657173

12
Entonces yi = ∑x
i =1
i − 6 =6.173078-6=0.746869

2.9 BOOTSTRAP PARAMÉTRICO

El Bootstrap es una técnica recientemente desarrollada, por medio de la cual se hace algún
tipo de inferencia estadística, ya que requiere de los elementos que las computadoras
modernas pueden proporcionar, en la siguiente sección se profundiza sobre dichas técnicas.
En dicho método basado en al computadora envuelve las mismas explicaciones que la
inferencia estadística tradicional, lo único realmente diferente es la implementación de
dichas ideas esto establece Efron y Tibshirani (1998).

Los métodos basados en la simulación de datos por medio de la computación


permiten la aplicación flexible, rápida y fácil de dichas ideas y sobre todo con un mínimo

19
CAPÍTULO 2. MARCO TEÓRICO

de conjeturas matemáticas. Podemos decir que el “bootstrap” es un método para asignar


medidas de exactitud a las estimaciones estadísticas que realiza.

Se pretende describir el bootstrap para la estimación del error estándar, desarrollado


por Efron (1979). Supongamos que se obtienen datos independientes x1 , x 2 ,....x n , para el
cual se computa el estadístico de interés s( x).

El algoritmo bootstrap comienza generando un número importante de muestras


bootstrap x *1 , x* 2 ,... x * B , cada una de ellas, se obtiene por un muestreo aleatorio de tamaño

n, con reemplazo de los datos originales x1 , x2 ,.... xn . Correspond iente a cada muestra

bootstrap se genera una réplica bootstrap s( x *b ) que nos es más que el valor del error

estándar s evaluado en x *b . Ahora bien, la estimación bootstrap del error estándar, es la


desviación estándar de las réplicas bootstrap,

1

[ ] 
B 2 2
 ∑ s( x ) − s(•)
*b

 b =1 
seˆ boot =  
 ( B −1) 
 

∑ s( x
b =1
*b
)
donde s(•) = , ver figura 2.2
B

20
CAPÍTULO 2. MARCO TEÓRICO

Réplicas bootstrap

s ( x *2 )
*1
s( x * B )
s(x )

x *2
x *1 Muestras bootstrap
x *B

x = ( x1 , x2 ,.... xn ) Datos originales

Fig., 2.2

Puesto sobre otras palabras, y de manera más general como describen Efron y
Tibshirani (1998). , supongamos que se tiene muestras aleatorias x = ( x1 , x2 ,.... xn ) de una
distribución de probabilidad F, de la cual se desea estimar el parámetro θ = t ( F ) con base

en x. Para cumplir dicho cometido, se calcula un estimado θˆ = t ( Fˆ ) .

De este modo, se define una muestra bootstrap como una muestra aleatoria de

tamaño n obtenida por reemplazo a partir de F̂ sea Fˆ → ( x1* , x2*...x *n ) = x * , ver esquema
de la figura 2.3

21
CAPÍTULO 2. MARCO TEÓRICO

Distribución Muestra s bootstrap Réplicas bootstrap Estimación


Empírica tamaño n de θˆ Bootstrap

x *1 θˆ * (1) = s ( x *1 )
x*2 θˆ * ( 2) = s ( x *2 )
x*3 θˆ * (3) = s( x * 3 )
F̂ . .
. .
. .
x*b θˆ * (b) = s ( x *b )
. .
. .
. .
x*B θˆ * ( B ) = s ( x * B )

1
 B * 
[ ]
2 2

 ∑ θˆ (b) − θˆ (• ) 
*

 b= 1 
seˆB =  
 ( B − 1) 
 
donde B

∑θˆ (b) *

θˆ (•) =
* b =1

B
Fig. 2.3

2.10 SIMULACIÓN

Si bien en ocasiones la simulació n es vista como un método de último recurso, es decir se


emplea cuando todo lo demás ha fallado, los recientes avances en metodologías,
disponibilidad de “software” y los desarrollos técnicos, han hecho de la simulación una
poderosa herramienta en el análisis de sistemas y en la investigación de operaciones, es así
como Rubinstein (1981) la define.

La simulación puede verse como una técnica de carácter numérico que controla
experimentos en un ordenador digital en la obtención de información. La metodología
implica el uso de ciertos tipos de modelos, tanto matemáticos como lógicos que

22
CAPÍTULO 2. MARCO TEÓRICO

finalmente estarán generando conocimiento, siendo esta característica una de sus


principales bondades. En ocasiones, el análisis de un sistema o proceso en el mundo real
puede ser una tarea bastante dura, por un lado se tiene el elevado costo que representa
obtener datos, y por el otro la complejidad, que aún matemáticamente resulta imposible
describir. En tales casos la simulación de datos resulta necesaria en la formulación de
hipótesis, puesto que permite el estudio y la experimentación de complejas interacciones
internas dentro del sistema. Así como puede igualmente estudiar el efecto en un cambio o
una infinidad de cambios en sus condiciones de operació n.

La simulación computacional también es capaz de provocar réplicas de un


experimento, y es aquí donde se debe centrar la atención, en el análisis estadístico. Una
réplica de un experimento significa volver a correr este mismo, pero ahora con cambios
seleccionados en los parámetros o en las condiciones de operación que la investigador le
interesa provocar. Cabe hacer mención que la simulación nos permite inducir de manera
bastante aceptable parámetros de interés, siempre y cuando exista independe ncia entre las
secuencias de números aleatorios que se estén generando. Así se mejora el análisis
estadístico, se prefiere por ejemplo una correlación positiva cuando los resultados de cada
experimento deben ser comparados como es el caso del bootstrap paramétrico antes
mencionado.

Si bien la simulación permite obtener observaciones o medidas generadas dentro del


sistema mismo, algunos podrían calificarla de imprecisa. Dado que más que producir
resultados exactos, únicamente proporciona estimaciones estadísticas. Sin embargo, el
planteamiento de estas inferencias es perfectamente sustentado, y si se cuenta con una
capacidad computacional excepcional resulta bastante eficaz en la mejora del sistema. Es
en este sentido que se presenta la simulación en este documento, como una técnica de
mejora en los experimentos de muestreo. Y aunado a un planteamiento correcto en la
programación de ideas estadísticas, se puede alcanzar en ocasiones resultados más
aceptables que las técnicas analíticas de inferencia tradicionales.

23
CAPÍTULO 2. MARCO TEÓRICO

2.11 FORTRAN

2.11.1 Introducción

El lenguaje FORTRAN se desarrollo en 1957, fue el primer lenguaje de programación de


alto nivel. El propósito inicial era el de realizar cálculos de tipo científico, aunque
posteriormente se utilizó como lenguaje de programación de uso general, ver Koffman
(1981).
Para que un calculo se realice es necesario una secuencia ordenada de operaciones
lógicas y aritméticas, a este conjunto de instrucciones se le denomina programa, si el
programa lo ejecutara un computador o máquina, estás instrucciones deben de escribirse en
lenguaje máquina, que no es más que un conjunto de códigos numéricos, que el
computador interpreta como una orden para llevar a cabo una operación específica.

FORTRAN como se define en Schick. (1974) es un acrónimo de FORmula


TRANslation (traducción de formulas) orientado a procedimientos, diseñado
especialmente para la manipulación de formulas científicas y a la aplicación de métodos
numéricos para la resolución de problemas. Dicho lenguaje, no es más que un conjunto
metódico de reglas donde es posible la preparación de un conjunto de instrucciones para el
computador denominado programa fuente.

El lenguaje consta de palabras claves o símbolos que interpreta o traduce el


computador por medio de un compilador trasformando dichas instrucciones en lenguaje de
máquina, de esta manera, el resultado de la traducción del programa fuente produce el
programa objeto almacenado y usado para llevar a cabo los cálculos deseados.

2.11.2 ORGANIZACIÓN DEL PROGRAMA

Un programa Fortran consiste esencialmente de un programa principal y en ocasiones de


varios subprogramas (o subrutinas), la estructura del programa generalmente se constituye
de:

24
CAPÍTULO 2. MARCO TEÓRICO

• Nombre del Programa


• Declaraciones
• Sentencias o proposiciones
• Stop
• End

2.11.3 SINTAXIS

La forma de escribir el código fuente, tiene un conjunto de reglas estrictas, lo que hace de
Fortran, como se mencionó antes un lenguaje de alto nivel, dentro de las reglas más
importantes son las de la posición en columnas. Fortran acepta información con un
máximo de 80 caracteres o columnas por fila o por línea, este espacio puede considerase
dividido en cuatro secciones o campos ver figura 2.4

1 2 5 6 7 72 73 80

Campo de proposiciones FORTRAN

Campo de continuación
Campo de etiquetas
Campo de comentarios
Campo de número de secuencia
Figura 2.4

En la mayoría de los casos, muchas de las líneas de un programa Fortran


comienzan con seis espacios en blanco y finalizan antes de la columna 72, es decir,
solamente el campo de sentencias se utiliza.

25
CAPÍTULO 2. MARCO TEÓRICO

2.11.4 TIPOS DE DATOS.

Fortran representa datos en diferentes modos, estos son:

1. Entero: números enteros.


2. Real: números que contienen un punto decimal.
3. Doble precisión: números enteros o reales almacenados con precisión adicional.
4. Complejo: números que contienen una parte real y una parte imaginaria.
5. Lógicos: valores lógicos o verdaderos
6. Alfanuméricos: información literal.

Cada uno de los cinco primeros modos del lenguaje Fortran permiten la definición
de constantes y de variables, éstas últimas representadas por nombres. El modo
alfanumérico se usa para representar datos literales, así se producen comentarios, títulos,
encabezamientos, etc.

2.11.5 CONSTANTES Y VARIABLES ENTERAS O DE PUNTO FIJO

Las constates enteras, se escriben en forma literal y sin punto decimal, estas pueden ser
positivas o negativas.
Las variables enteras se representa por nombres de uno a seis caracteres, el modo
entero de la variable se denota por medio del primer carácter el cual debe ser: I, J, K, L,
M, N.

2.11.6 CONSTANTES Y VARIABLES REALES O DE PUNTO FLOTANTE

Las primeras se pueden representar de dos maneras, con exponente o sin el. El valor de una
constante con exponente se representa de una manera similar a la notación científica. En
FORTRAN el numero se representa como una constante real sin exponente, seguida por la
letra E y una constante entera de uno o dos dígitos; la constante entera representa la
potencia y puede ser positiva o negativa. En lo que concierne a una constate real sin
exponente, ésta se representa con un conjunto de dígitos y un punto decimal.

26
CAPÍTULO 2. MARCO TEÓRICO

La variables reales al igual que las enteras se representan por nombres, compuestos
de uno a seis caracteres, el cual puede ser una letra cualquiera diferente de: I, J, K, L, M, N.

2.11.7 OPERADORES ARITMÉTICOS

Los operadores aritméticos permitidos en Fortran, junto con su representación simbólica


son los siguientes de la más alta jerarquía a la más baja:

** Exponenciación.
* Multiplicación
/ División
+ Suma
- Resta

2.11.8 PROPOSICIONES FORTRAN

Por medio de las proposiciones el operador controla la operación del conmutador, como se
dijo anteriormente, un conjunto de estas proposiciones colocadas en un orden adecuado
constituyen un programa fuente.

Existen proposiciones de ejecución son aquellas que resultan en alguna


instrucción que le computador debe llevar a cabo, los siguientes tipos son:

· Proposiciones de asignación
· Proposiciones de control
· Proposiciones de trasferencia incondicional
· Proposiciones de trasferencia condicional
· Proposiciones de entrada salida

Así como las proposiciones de no ejecución, que proveen únicamente información


necesaria para la ejecución adecuada de un programa, los tipos son:

· Declaración de especificación

27
CAPÍTULO 2. MARCO TEÓRICO

· Declaración de tipo
· Declaración de definición

2.11.9 PROPOSICIONES DE ASIGNACIÓN

Una asignación tiene la forma:

v = exp

Donde v es una variable entera, real, de precisión doble, o compleja, sin signo, y
exp es cualquier expresión numérica. Se evalúa primeramente el lado derecho y se asigna
el valor del resultado a la variable de la izquierda, la expresión de la derecha no está exenta
de contener otras variables, pero éstas no cambiaran de valor.

2.11.10 EXPRESIONES LÓGICAS

Una expresión lógica, únicamente puede tomar el valor lógico de .TRUE. o bien del
valor lógico de .FALSE. Dichos valores aparecen como resultado de la comparación
aritmética en el uso de los siguientes operadores de relación, ver tabla 2.4:

Descripción Símbolo Algebraico Símbolo en FORTRAN


Igual a = .EQ.
No igual a ? .NE.
Menor a < .LT.
Menor o igual a = .LE.
Mayor a > .GT.
Mayor o igual a = .GE.
Tabla 2.4

Las expresiones lógicas pueden combinarse con los operadores lógicos .AND.
.OR. .NOT. que corresponden a los operadores lógicos conocidos Y, O, y la negación
respectivamente.

28
CAPÍTULO 2. MARCO TEÓRICO

2.11.11 PROPOSICION READ

La proposición READ es una preposición ejecutable se escribe de la siguiente forma:

READ (m, n ) lista

Donde m es una constate o variable entera que hacer referencia al dispositivo de


entrada, y n es el número de proposición correspondiente a una proposición FORMAT,
finalmente lista es una secuencia ordenada de uno o más nombres de variables separadas
por comas. Esta preposición examina un archivo de datos y los transmite la información
contenida

2.11.12 PROPOCISON WRITE

La proposición WRITE es una preposición ejecutable se escribe de la siguiente forma:

WRITE ( m, n ) lista

Donde m es una constate o variable entera que hacer referencia al dispositivo de


entrada, y n es el número de proposición correspondiente a una proposición FORMAT,
finalmente lista es una secuencia ordenada de uno o más nombres de variables separadas
por comas. Esta preposición hace que los datos almacenados en lista, sean transmitidos al
dispositivo especificado por m y de acuerdo al formato descrito por FORMAT.

2.11.13 PROPOCISON PRINT

Una de las formas de la proposición WRITE es la proposición PRINT una proposición


ejecutable se escribe de la siguiente forma:

PRINT n lista

Donde n y lista tiene el mismo significado descrito anteriormente, PRINT hace que
los datos se impriman de acuerdo al formato especificado, en pantalla..

29
CAPÍTULO 2. MARCO TEÓRICO

2.11.14 PROPOCISON FORMAT

La proposición FORMAT es una preposición no ejecutable se escribe de la siguiente


forma:
nFORMAT ( s1 , s 2 ,...s m )

Aquí n es un número de proposición de entrada o salida, y s1 , s 2 ,...s m es una lista


ordenada de especificaciones de formato, se tratarán más adelante. Dicha proposición
suministra al computador información acerca al tipo de datos y la forma de representación
que se usa al transmitir o al almacenar, se coloca la proposición FORMAT enseguida de las
preposiciones READ o WRITE, como esta proposición proporciona información al
computador, varias proposiciones pueden hacer referencia a una misma proposición
FORMAT.

2.11.15 ESPECIFICACIONES DE LA PROPOCISIÓN FORMAT

Las letras para códigos de formato más comunes son:


A Cadenas de texto.
D Números de doble precisión, notación científica
E Números reales, notación científica
F Números reales, formato punto fijo
I Entero
X Salto horizontal (espacio)
/ Salto vertical (nueva línea)

2.11.16 PROPOSICIÓN GO TO

Antes dicho, el computador lleva a cabo las instrucciones en orden, dicha secuencia se
puede alterar a través de preposiciones de transferencia, existen las trasferencias de tipo
condicional donde se produce un cambio o salto claramente especificado, como de tipo

30
CAPÍTULO 2. MARCO TEÓRICO

incondicional donde se produce igualmente una transferencia que se escoge dentro de


varias alternativas, la proposición GO TO pertenece a las primeras.

La proposición GO TO es ejecutable y se escribe de la siguiente manera:

GO TO n

Donde n es un número de proposición (una constante entera). Esta sentencia hace


que se transfiera control (tome la siguiente instrucción) a la proposición que n menciona.

2.11.17 PROPOSICION IF

La proposición IF lógica, dado que existe la proposición IF aritmética de la cual no se


hablará, es una proposición ejecutable y de transferencia condicional, se escribe siempre en
la forma de dos proposiciones escritas como sigue:

IF (exp) prop1
prop2

Donde exp es una expresión lógica y las prop1 y prop2 son ejecutables en Fortran,
se prosigue de la siguiente manera, si el valor es .TRUE. el programa procesa prop1 , en
cambio si la valor es .FALSE. el programa pasa inmediatamente a procesar prop2 y se
ignora prop1 .

2.11.18 EL CICLO DO

Un algoritmo es un proceso para resolver un problema como enfatiza Schick. (1974), para
que este sea conciso, debe ser verdadero, también debe de explorar todas la alternativas y
debe arrojar una respuesta en un numero finito de pasos. En dichos algoritmos, es necesario
realizar un cálculo varias veces usando un valor diferente para cada variable, en cada
repetición o iteración. Esto se conoce como repetición de ciclo.

31
CAPÍTULO 2. MARCO TEÓRICO

2.11.19 PROPOSICIÓN DO

La proposición DO es una función ejecutable que puede escribirse de dos maneras:

DO n i = n1 , n 2 , n3 , o bien,

DO n i = n1 , n2
Donde se tiene n, que es el número correspondiente a la última proposición del
ciclo, i es una variable entera, sin índice cuyo valor se aumenta en cada iteración.
Finalmente se tiene:

n1 Es el valor de inicio de i, llamada índice.

n2 Es el valor máximo que i puede asumir, es el valor de prueba.

n3 Es el incremento, es el valor de incremento de i en cada repetición, si este no


se especifica en la escritura, toma un valor de uno.

2.11.20 FUNCIONES

Las funciones en Fortran son bastante similares a las funciones matemáticas: ambas toman
un conjunto de variables de entrada (parámetros) y regresan un valor de algún tipo.

Un ejemplo simple muestra como usar una función:

x = cos (π / 3 .0 )

En este caso la función coseno, asignará a la variable x un valor. Hay varias


funciones incorporadas en Fortran. Algunas de las más comunes son:

32
CAPÍTULO 2. MARCO TEÓRICO

Descripción Símbolo Algebraico Símbolo en FORTRAN


Valor absoluto x ABS(X)

Raíz cuadrada x SQRT(X)

Seno sin( x) SIN(X)


Coseno cos(x) COS(X)
Logaritmo natural cos(x) ALOG(X)
Arco tangente arctan( x) ATAN(X)
Exponencial ex EXP(X)
Tabla 2.5

La estructura de una función es parecida a la del programa principal. Las diferencias


que existen son de tipo; éste debe coincidir con el tipo de la variable que recibirá el valor.
Diferencias de valor; el valor que devolverá la función, deberá ser asignado en una variable
que tenga el mismo nombre que la función. También las funciones son terminadas con la
sentencia RETURN en vez de la sentencia STOP.

Para resumir, la sintaxis general de una función en Fortran es:

TIPO función NOMBRE (lista _ de parámetros)


Declaraciones
Sentencias
RETURN
END

La función es llamada simplemente usando el nombre de la función y haciendo una lista de


argumentos entre paréntesis.

2.11.21 SUBRUTINAS

Una función de Fortran puede devolver únicamente un valor. En ocasiones se desean


regresar dos o más valores y en ocasiones ninguno. Para este propósito se usa la
construcción de una subrutina.

33
CAPÍTULO 2. MARCO TEÓRICO

La sintaxis es la siguiente:

SUBROUTINE nombre (lista_de_parámetros)


Declaraciones
Sentencias
RETURN
End

Los elementos de una subrutina, son los siguientes:

a) Una proposición SUBROUTINE, que define la rutina


b) Una proposición DIMENSION que se usa con los arreglos
c) Una proposición COMMON para trasmitir valores implícitamente entre
la subrutina y el programa principal.
d) Proposiciones Fortran para las operaciones requeridas
e) Proposición RETURN
f) Finalmente la proposición END

Se da un ejemplo de una subrutina muy sencilla. El propósito de la subrutina es


intercambiar dos valores enteros

SUBROUTINE iswap (a, b)

integer a, b
integer Tmp

tmp = a

a= b
b = Tmp

return

end.

34
CAPÍTULO 2. MARCO TEÓRICO

2.11.22 PROPOSICION SUBROUTINE

La proposición SUBROUTINE es una proposición de tipo no ejecutable que se escribe:

SUBROUTINE nombre (v1 , v 2 ,..., vm ) .

Donde nombre es el nombre asignado a la subrutina y v1 , v 2 ,..., v m son los


nombres de los argumentos ficticios que son usados para definir la subrutina.

2.11.23 PROPOSICION CALL

La proposición CALL entra dentro de las proposiciones ejecutables de Forran, se escribe


como sigue:

CALL nombre (a1 , a2 ,..., am )

Donde nombre es el nombre de la subrutina y a1 , a 2 ,..., am es la lista de los


argumentos que se van a usar en la subrutina, hace que el programa transfiera control al
inicio de la subrutina que se está llamando para seguir calculando.

2.11.24 PROPOSICION COMMON

Esta es una proposición ejecutable que se escribe como sigue:

COMMON v1 , v 2 ,..., v n

Donde v1 , v 2 ,..., v n es una lista de variables o de arreglos. La proposición


COMMON provoca que los nombres que aparecen en la lista, se les asigne direcciones de
un área especial de almacenamiento conocida como bloque común, el programa principal y
las subrutinas pueden tener acceso al bloque común de almacenaje.

35
CAPÍTULO 2. MARCO TEÓRICO

2.11.25 PROPOSICION RETURN

Esta es una proposición ejecutable que se usa en los subprogramas Esta proposición hace
que el computador transfiera control al programa principal que hizo referencia al
subprograma. Así el programa principal se retorna inmediatamente después del lugar
donde se llamó a la subrutina.

2.11.26 PROPOSICION DIMESION

Cualquier variable del lenguaje Fortran puede tener uno, dos o tres subíndices. Esto quiere
decir que cualquier nombre de una variable pude representar un arreglo de una dos o tres
dimensiones.

La proposición DIMENSION es una proposición de especificación, no ejecutable,


que se representa de la siguiente forma:

DIMENSION nombre ( n1 , n2 , n 3 )

Donde nombre es le no mbre dado, al arreglo o variable con subíndice, entonces


n1 , n2 , n3 son constantes enteras que indican los valores máximos de los subíndices.

36

Potrebbero piacerti anche