Download - Aplicación de la Simulación Regenerഀ愀琀椀瘀愀礀氀愀吀挀渀椀 …sisbib.unmsm.edu.pe/BibVirtualData/monografias/basic/... · 2007-04-24 · Aplicación de la simulación

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE CIENCIAS MATEMATICAS E.A.P. DE..INVESTIGACIÓN OPERATIVA

Aplicación de la simulación regenerativa y la técnica bootstrap, para mejorar la calidad del estimador. Capítulo3. Introducción a la simulación regenerativa

MONOGRAFÍA

Para optar el Título de Licenciado en Investigación Operativa

AUTOR

Carlos Guerrero Moncada

LIMA – PERÚ 2002

Aplicación de la simulación regenerativa y la técnica de bootstrap, para mejorar la calidad del estimador

Universidad Nacional Mayor de San Marcos

3

INTRODUCCIÓN A LA SIMULACION REGENERATIVA

La simulación regenerativa proviene de considerar que el proceso de salida sea

regenerativo, Ross ( 1993 ).

Este nuevo enfoque se basa en el hecho de que muchos sistemas estocásticos se

regeneran, es decir, empiezan en el mismo punto de partida a partir de intervalos

regulares de tiempo.

Un proceso ?Xt?t>0 es regenerativo si existen instantes en los que el proceso

recomienza probabilísticamente, es decir, con probabilidad 1, y existe un instante

T1 tal que la continuación del proceso más allá de T1 coincide, probabilísticamente,

con la realización del proceso desde 1. Esto implica que existen T2, T3,... con la

misma propiedad que T1. Se sigue además que T1, T2,... son los tiempos entre

llegadas de un proceso de renovación.

Decimos que se completa un ciclo cada vez que se completa una renovación.

Por ejemplo, consideremos un sistema de líneas de espera en el que los clientes

llegan de acuerdo con un proceso Poisson y supongamos que el primer cliente

llega en el instante 0. Si el tiempo aleatorio T representa el siguiente instante en

que una llegada encuentra al sistema vacío, entonces decimos que el tiempo de 0

a T constituye el primer ciclo. El segundo ciclo sería entonces el tiempo desde T

hasta el primer instante posterior a T en que una llegada encuentra al sistema

vacío, y así sucesivamente ( Ross, 1999 ).

En la mayor parte de los modelos, es fácil ver que los movimientos del proceso en

cada ciclo son independientes e idénticamente distribuidos. Por lo que si

consideramos un ciclo como un día, entonces todo el análisis realizado para la

técnica Bootstrap sigue siendo válido.



4

Ejemplo : Simulación de un sistema de colas con un servidor

La representación de un sistema de colas de un servidor aparece en la siguiente

figura. Aquí se puede apreciar que los clientes son generados por una fuente

alimentadora , la cual genera n número de clientes por unidad de tiempo. Si un

cliente que llega al sistema encuentra desocupado el servidor, entonces es

atendido inmediatamente y se retira luego de ser servido. Por el contrario, si un

cliente al arribar encuentra a un servidor ocupado, entonces este cliente pasa a

una sala de espera donde esperará su turno para ser servido. Finalmente, los

clientes que permanecen en la cola, son servidos en base a la disciplina FIFO

(Primero en llegar, primero en ser servido ) .

Para el sistema en particular suponemos que el tiempo entre llegadas es una

variable aleatoria exponencial con parámetro 12. También, suponemos que el

tiempo de servicio es una variable aleatoria exponencial con parámetro 15.

Además, suponga que la forma de evaluar el funcionamiento y operación del

sistema, es en base al valor esperado del tiempo que un cliente permanece en la

cola E(W), cuando el sistema se encuentra en una situación de estado estable.

Para este sistema en particular, no existen procedimientos analíticos capaces de

obtener E(W). Por consiguiente, la única forma de evaluar y analizar este sistema

es mediante simulación.



5

Por consiguiente, el objetivo de la simulación de este sistema, es analizar los

resultados obtenidos con el propósito de estimar E(W). Más generalmente, se

desea que la estimación de E(W) sea confiable , es decir, se requiere que el valor

de E(W) permanezca a un intervalo con un cierto nivel de confianza, por ejemplo

del 95% (a =5%).

Una forma razonable de estimar E(W) sería: sea W1 el tiempo de espera en la cola

del cliente 1, W2 el tiempo de espera en la cola del cliente 2, y así sucesivamente.

Por consiguiente, si durante la simulación del sistema entraron a este n clientes,

entonces el promedio muestral sería:

El cual representa a un estimador consistente de E(W). Sin embargo, el promedio

muestral sería en general un estimador sesgado de E(W) debido a las condiciones

iniciales. Por ejemplo , si W1 tiene un valor de cero, entonces los tiempos de

espera de los primeros clientes tienden a ser pequeños.

La forma tradicional de tratar el sesgo del estimador debido a condiciones

iniciales, es correr el modelo de simulación durante algún tiempo sin colectar

ningún dato, hasta que el sistema de colas haya alcanzado la condición de estado

estable. A partir de este instante, se empieza a colectar la información. Por

ejemplo, se puede simular el sistema para 1000 clientes y solo considerar los

tiempos de espera de los últimos 500, y entonces usar:



6

como un estimador de E(W). Sin embargo, esta solución no es muy recomendable

por la siguiente razón:

1. Es muy difícil determinar la longitud del periodo de estabilización.

2. Una gran cantidad de tiempo de computadora es desperdiciado.

Otra de las desventajas que encontramos es la alta correlación que existe entre W i

y Wi+1 independientemente de que el sistema se encuentra o no en estado estable.

Por lo que, si los Wi no son independientes, no podemos hallar intervalos de

confianza para el tiempo promedio de espera mediante la teoría estadística

conocida.



7

DESCRIPCIÓN DE LA SIMULACIÓN REGENERATIVA

Explicamos la lógica mediante el siguiente esquema, Suponemos que al inicio de

la simulación se establece W1 = 0. Luego se inicia la simulación en la que se

observan los tiempos de espera para cada uno de los clientes, Suponiendo que

los tiempos observados son los que mostramos a continuación, con los Wi

diferentes de cero.

En el esquema anterior observamos que el tiempo de espera para cada uno de los

clientes 1, 5, 8, 9, ... , n-6, n-2 es igual a cero ya que encontraron desocupado al

servidor a la hora de llegar al sistema. También, se puede observar que el servidor

está constantemente ocupado desde que llega el cliente 1 hasta que se va el

cliente 4, luego se encuentra ocioso que llega el cliente 5, y así sucesivamente.

Por consiguiente, si al tiempo que transcurre entre empezar a servir y quedar

ocioso, se le considera como un ciclo, entonces para el esquema mostrado existen

k ciclos para un total de n clientes, donde el primer ciclo lo comprenden los



8

clientes 1, 2, 3, 4, el segundo ciclo lo comprenden los clientes 5, 6, 7, el tercer ciclo

lo comprende el cliente 8, y así sucesivamente. Por lo que, un nuevo ciclo

empieza cuando un cliente llega al sistema y encuentra al servidor ocioso.

Puesto que cada vez que llega un cliente al sistema y encuentra al servidor

ocioso, es equivalente y está gobernado por la misma estructura probabilística que

cuando llega el primer cliente al sistema, entonces sería razonable agrupar los

resultados de la simulación en bloques de datos, donde el primer bloque

contendrá los tiempos de espera en la cola de los clientes que forman parte del

primer ciclo, el segundo bloque contendrá los tiempos de espera en la cola de los

clientes que forman parte del segundo ciclo, y así sucesivamente. Para el

esquema dado, los bloques serían :

( W1, W2, W3, W4 ), ( W5, W6, W7 ), ( W8 ), (W9, W10, W11, ... ), ...

... , ( Wn-6, Wn-5, Wn-4, Wn-3 ), (Wn-2, Wn-1, Wn ).

De este modo, puesto que cada ciclo es iniciado en las mismas condiciones, los

bloques de datos de ciclos sucesivos son estadísticamente independientes e

idénticamente distribuidos. Por lo tanto, si definimos Dj como la suma de los

tiempos de espera de todos los clientes servidos el ciclo j, y Nj como el número de

clientes que llegan al sistema durante el ciclo j, entonces los pares (D1,N1), (D2,N2),

(D3,N3) ... (Dk,Nk) son estadísticamente independientes e idénticamente

distribuidos, a pesar de la correlación que existe entre Dj y Nj , j = 1, 2, 3, ... ,k.

Donde :

D1 = W1 + W2 + W3 + W4

N1 = 4

donde N1 = 4 ya que en el primer ciclo tenemos las llegadas de 4 clientes, cada

uno con su respectivo tiempo de servicio. Para el ejemplo, W1 representa el tiempo

de servicio para el primer cliente, W2 representa el tiempo de servicio para el

segundo cliente , W3 representa el tiempo de servicio para el tercer cliente , y W4

representa el tiempo de servicio para el cuarto cliente. Esta misma lógica la

aplicamos para cada uno de los pares (Dj , Nj) .



9

Por lo tanto, la correlación entre Wk y WK+1 ha sido eliminada y los datos han sido

agrupados en bloques estadísticamente independientes e idénticamente

distribuidos.

Suponiendo que n clientes fueron servidos durante la simulación, a partir de los

cuales se formaron k ciclos, la estimación del tiempo de espera en la cola se

puede determinar por medio de la siguiente expresión :

dividiendo entre k los dos términos de la segunda expresión, obtenemos :

Dado que (D1,D2,D3, ... , Dk) , (N1, N2, N3, ... ,Nk) son grupos de variables aleatorias

independientes e idénticamente distribuidas, entonces por el teorema del límite

central, la expresión anterior converge a :

Por lo tanto, el problema de estimar E(W) se traduce a estimar E(D) / E(N). Dado

que E(D) / E(N) puede ser estimado a partir de (D1,N1), (D2,N2), (D3,N3) ... (Dk,Nk),

la estadística clásica puede ser utilizada para hacer inferencias acerca del

verdadero valor de E(W).



10

INTERVALO DE CONFIANZA PARA E (W)

Para la construcción del intervalo de confianza haremos uso del teorema de límite

central. Primero consideraremos las siguientes igualdades :

Donde :

U1 = D1 – t N1

U2 = D2 – t N2 , así sucesivamente.

De la segunda igualdad ( Uj = Dj – t Nj ) vemos que las Uj son independientes e

idénticamente distribuidas, y además :

El cual deducimos de la primera igualdad de la siguiente manera:



11

Además :

Y del hecho que las Uj se encuentran idénticamente distribuidas, obtenemos:

Por lo que:

También de la segunda igualdad (Uj = Dj – t Nj) se obtiene la siguiente identidad :

Donde :

Por lo tanto, ?U sigue distribución normal con media y varianza que damos a

continuación:



12

Por lo tanto:

Sigue una distribución normal con media 0 y varianza 1. Dado que ?U =?D – t?N,

reemplazamos en la expresión anterior y obtenemos :

Como t podemos estimarlo a partir de:

de donde:

Reemplazamos en (1) y obtenemos:



13

De acuerdo a esta ultima expresión, y suponiendo un nivel de significado a, el

intervalo de confianza del parámetro t = E(W) será :

Donde el valor de s 2 lo hallamos de la siguiente manera:

Donde :

Por lo que:

Donde los valores de las varianzas y la covarianza pueden ser estimados como

siguen:



14

Por consiguiente, la estimación de s2 se puede obtener de acuerdo a la siguiente

expresión:

el cual reemplazamos en (*) y obtenemos el intervalo de confianza para el

parámetro t, que damos a continuación:

el cual define un intervalo cuyo ancho es:

Además, con probabilidad 1 - ? el valor de t se encontrará dentro de la región:

Observación

Recordemos que:



15

tiene exactamente una distribución t con n – 1 grados de libertad, tn-1, de manera

que el intervalo exacto correspondiente será:

Pero, para k suficientemente grande ( k > 30), las distribución tk y la distribución

N ~ ( 0,1 ) se parecen mucho, por lo que apenas habrá una pequeña diferencia

entre ambos intervalos.

Download - Aplicación de la Simulación Regenerഀ愀琀椀瘀愀 礀 氀愀 吀 挀渀椀 …sisbib.unmsm.edu.pe/BibVirtualData/monografias/basic/... · 2007-04-24 · Aplicación de la simulación

Top Related

Download - Aplicación de la Simulación Regenerഀ愀琀椀瘀愀礀氀愀吀挀渀椀 …sisbib.unmsm.edu.pe/BibVirtualData/monografias/basic/... · 2007-04-24 · Aplicación de la simulación