UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE CIENCIAS MATEMATICAS E.A.P. DE..INVESTIGACIÓN OPERATIVA
Aplicación de la simulación regenerativa y la técnica bootstrap, para mejorar la calidad del estimador. Capítulo3. Introducción a la simulación regenerativa
MONOGRAFÍA
Para optar el Título de Licenciado en Investigación Operativa
AUTOR
Carlos Guerrero Moncada
LIMA – PERÚ 2002
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
3
INTRODUCCIÓN A LA SIMULACION REGENERATIVA
La simulación regenerativa proviene de considerar que el proceso de salida sea
regenerativo, Ross ( 1993 ).
Este nuevo enfoque se basa en el hecho de que muchos sistemas estocásticos se
regeneran, es decir, empiezan en el mismo punto de partida a partir de intervalos
regulares de tiempo.
Un proceso ?Xt?t>0 es regenerativo si existen instantes en los que el proceso
recomienza probabilísticamente, es decir, con probabilidad 1, y existe un instante
T1 tal que la continuación del proceso más allá de T1 coincide, probabilísticamente,
con la realización del proceso desde 1. Esto implica que existen T2, T3,... con la
misma propiedad que T1. Se sigue además que T1, T2,... son los tiempos entre
llegadas de un proceso de renovación.
Decimos que se completa un ciclo cada vez que se completa una renovación.
Por ejemplo, consideremos un sistema de líneas de espera en el que los clientes
llegan de acuerdo con un proceso Poisson y supongamos que el primer cliente
llega en el instante 0. Si el tiempo aleatorio T representa el siguiente instante en
que una llegada encuentra al sistema vacío, entonces decimos que el tiempo de 0
a T constituye el primer ciclo. El segundo ciclo sería entonces el tiempo desde T
hasta el primer instante posterior a T en que una llegada encuentra al sistema
vacío, y así sucesivamente ( Ross, 1999 ).
En la mayor parte de los modelos, es fácil ver que los movimientos del proceso en
cada ciclo son independientes e idénticamente distribuidos. Por lo que si
consideramos un ciclo como un día, entonces todo el análisis realizado para la
técnica Bootstrap sigue siendo válido.
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
4
Ejemplo : Simulación de un sistema de colas con un servidor
La representación de un sistema de colas de un servidor aparece en la siguiente
figura. Aquí se puede apreciar que los clientes son generados por una fuente
alimentadora , la cual genera n número de clientes por unidad de tiempo. Si un
cliente que llega al sistema encuentra desocupado el servidor, entonces es
atendido inmediatamente y se retira luego de ser servido. Por el contrario, si un
cliente al arribar encuentra a un servidor ocupado, entonces este cliente pasa a
una sala de espera donde esperará su turno para ser servido. Finalmente, los
clientes que permanecen en la cola, son servidos en base a la disciplina FIFO
(Primero en llegar, primero en ser servido ) .
Para el sistema en particular suponemos que el tiempo entre llegadas es una
variable aleatoria exponencial con parámetro 12. También, suponemos que el
tiempo de servicio es una variable aleatoria exponencial con parámetro 15.
Además, suponga que la forma de evaluar el funcionamiento y operación del
sistema, es en base al valor esperado del tiempo que un cliente permanece en la
cola E(W), cuando el sistema se encuentra en una situación de estado estable.
Para este sistema en particular, no existen procedimientos analíticos capaces de
obtener E(W). Por consiguiente, la única forma de evaluar y analizar este sistema
es mediante simulación.
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
5
Por consiguiente, el objetivo de la simulación de este sistema, es analizar los
resultados obtenidos con el propósito de estimar E(W). Más generalmente, se
desea que la estimación de E(W) sea confiable , es decir, se requiere que el valor
de E(W) permanezca a un intervalo con un cierto nivel de confianza, por ejemplo
del 95% (a =5%).
Una forma razonable de estimar E(W) sería: sea W1 el tiempo de espera en la cola
del cliente 1, W2 el tiempo de espera en la cola del cliente 2, y así sucesivamente.
Por consiguiente, si durante la simulación del sistema entraron a este n clientes,
entonces el promedio muestral sería:
El cual representa a un estimador consistente de E(W). Sin embargo, el promedio
muestral sería en general un estimador sesgado de E(W) debido a las condiciones
iniciales. Por ejemplo , si W1 tiene un valor de cero, entonces los tiempos de
espera de los primeros clientes tienden a ser pequeños.
La forma tradicional de tratar el sesgo del estimador debido a condiciones
iniciales, es correr el modelo de simulación durante algún tiempo sin colectar
ningún dato, hasta que el sistema de colas haya alcanzado la condición de estado
estable. A partir de este instante, se empieza a colectar la información. Por
ejemplo, se puede simular el sistema para 1000 clientes y solo considerar los
tiempos de espera de los últimos 500, y entonces usar:
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
6
como un estimador de E(W). Sin embargo, esta solución no es muy recomendable
por la siguiente razón:
1. Es muy difícil determinar la longitud del periodo de estabilización.
2. Una gran cantidad de tiempo de computadora es desperdiciado.
Otra de las desventajas que encontramos es la alta correlación que existe entre W i
y Wi+1 independientemente de que el sistema se encuentra o no en estado estable.
Por lo que, si los Wi no son independientes, no podemos hallar intervalos de
confianza para el tiempo promedio de espera mediante la teoría estadística
conocida.
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
7
DESCRIPCIÓN DE LA SIMULACIÓN REGENERATIVA
Explicamos la lógica mediante el siguiente esquema, Suponemos que al inicio de
la simulación se establece W1 = 0. Luego se inicia la simulación en la que se
observan los tiempos de espera para cada uno de los clientes, Suponiendo que
los tiempos observados son los que mostramos a continuación, con los Wi
diferentes de cero.
En el esquema anterior observamos que el tiempo de espera para cada uno de los
clientes 1, 5, 8, 9, ... , n-6, n-2 es igual a cero ya que encontraron desocupado al
servidor a la hora de llegar al sistema. También, se puede observar que el servidor
está constantemente ocupado desde que llega el cliente 1 hasta que se va el
cliente 4, luego se encuentra ocioso que llega el cliente 5, y así sucesivamente.
Por consiguiente, si al tiempo que transcurre entre empezar a servir y quedar
ocioso, se le considera como un ciclo, entonces para el esquema mostrado existen
k ciclos para un total de n clientes, donde el primer ciclo lo comprenden los
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
8
clientes 1, 2, 3, 4, el segundo ciclo lo comprenden los clientes 5, 6, 7, el tercer ciclo
lo comprende el cliente 8, y así sucesivamente. Por lo que, un nuevo ciclo
empieza cuando un cliente llega al sistema y encuentra al servidor ocioso.
Puesto que cada vez que llega un cliente al sistema y encuentra al servidor
ocioso, es equivalente y está gobernado por la misma estructura probabilística que
cuando llega el primer cliente al sistema, entonces sería razonable agrupar los
resultados de la simulación en bloques de datos, donde el primer bloque
contendrá los tiempos de espera en la cola de los clientes que forman parte del
primer ciclo, el segundo bloque contendrá los tiempos de espera en la cola de los
clientes que forman parte del segundo ciclo, y así sucesivamente. Para el
esquema dado, los bloques serían :
( W1, W2, W3, W4 ), ( W5, W6, W7 ), ( W8 ), (W9, W10, W11, ... ), ...
... , ( Wn-6, Wn-5, Wn-4, Wn-3 ), (Wn-2, Wn-1, Wn ).
De este modo, puesto que cada ciclo es iniciado en las mismas condiciones, los
bloques de datos de ciclos sucesivos son estadísticamente independientes e
idénticamente distribuidos. Por lo tanto, si definimos Dj como la suma de los
tiempos de espera de todos los clientes servidos el ciclo j, y Nj como el número de
clientes que llegan al sistema durante el ciclo j, entonces los pares (D1,N1), (D2,N2),
(D3,N3) ... (Dk,Nk) son estadísticamente independientes e idénticamente
distribuidos, a pesar de la correlación que existe entre Dj y Nj , j = 1, 2, 3, ... ,k.
Donde :
D1 = W1 + W2 + W3 + W4
N1 = 4
donde N1 = 4 ya que en el primer ciclo tenemos las llegadas de 4 clientes, cada
uno con su respectivo tiempo de servicio. Para el ejemplo, W1 representa el tiempo
de servicio para el primer cliente, W2 representa el tiempo de servicio para el
segundo cliente , W3 representa el tiempo de servicio para el tercer cliente , y W4
representa el tiempo de servicio para el cuarto cliente. Esta misma lógica la
aplicamos para cada uno de los pares (Dj , Nj) .
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
9
Por lo tanto, la correlación entre Wk y WK+1 ha sido eliminada y los datos han sido
agrupados en bloques estadísticamente independientes e idénticamente
distribuidos.
Suponiendo que n clientes fueron servidos durante la simulación, a partir de los
cuales se formaron k ciclos, la estimación del tiempo de espera en la cola se
puede determinar por medio de la siguiente expresión :
dividiendo entre k los dos términos de la segunda expresión, obtenemos :
Dado que (D1,D2,D3, ... , Dk) , (N1, N2, N3, ... ,Nk) son grupos de variables aleatorias
independientes e idénticamente distribuidas, entonces por el teorema del límite
central, la expresión anterior converge a :
Por lo tanto, el problema de estimar E(W) se traduce a estimar E(D) / E(N). Dado
que E(D) / E(N) puede ser estimado a partir de (D1,N1), (D2,N2), (D3,N3) ... (Dk,Nk),
la estadística clásica puede ser utilizada para hacer inferencias acerca del
verdadero valor de E(W).
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
10
INTERVALO DE CONFIANZA PARA E (W)
Para la construcción del intervalo de confianza haremos uso del teorema de límite
central. Primero consideraremos las siguientes igualdades :
Donde :
U1 = D1 – t N1
U2 = D2 – t N2 , así sucesivamente.
De la segunda igualdad ( Uj = Dj – t Nj ) vemos que las Uj son independientes e
idénticamente distribuidas, y además :
El cual deducimos de la primera igualdad de la siguiente manera:
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
11
Además :
Y del hecho que las Uj se encuentran idénticamente distribuidas, obtenemos:
Por lo que:
También de la segunda igualdad (Uj = Dj – t Nj) se obtiene la siguiente identidad :
Donde :
Por lo tanto, ?U sigue distribución normal con media y varianza que damos a
continuación:
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
12
Por lo tanto:
Sigue una distribución normal con media 0 y varianza 1. Dado que ?U =?D – t?N,
reemplazamos en la expresión anterior y obtenemos :
Como t podemos estimarlo a partir de:
de donde:
Reemplazamos en (1) y obtenemos:
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
13
De acuerdo a esta ultima expresión, y suponiendo un nivel de significado a, el
intervalo de confianza del parámetro t = E(W) será :
Donde el valor de s 2 lo hallamos de la siguiente manera:
Donde :
Por lo que:
Donde los valores de las varianzas y la covarianza pueden ser estimados como
siguen:
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
14
Por consiguiente, la estimación de s2 se puede obtener de acuerdo a la siguiente
expresión:
el cual reemplazamos en (*) y obtenemos el intervalo de confianza para el
parámetro t, que damos a continuación:
el cual define un intervalo cuyo ancho es:
Además, con probabilidad 1 - ? el valor de t se encontrará dentro de la región:
Observación
Recordemos que:
Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador
Universidad Nacional Mayor de San Marcos
15
tiene exactamente una distribución t con n – 1 grados de libertad, tn-1, de manera
que el intervalo exacto correspondiente será:
Pero, para k suficientemente grande ( k > 30), las distribución tk y la distribución
N ~ ( 0,1 ) se parecen mucho, por lo que apenas habrá una pequeña diferencia
entre ambos intervalos.