informe simulacion analis-salidassimulacion

25
1 Universidad de Oriente Núcleo Nueva Esparta Escuela de Ingeniería y Ciencias Aplicadas Lic. Informática Análisis de las salidas de la simulación

Upload: ines-rodriguez

Post on 12-Apr-2017

156 views

Category:

Engineering


0 download

TRANSCRIPT

1

Universidad de Oriente Núcleo Nueva Esparta

Escuela de Ingeniería y Ciencias Aplicadas

Lic. Informática

Análisis de las salidas de la simulación

2

Índice

Pág. Introducción………………………………………………………………………………….3 Calculo de número de Corridas……………………………………………………………5 Contadores de Estadísticas Sumarias......................................................................11 Análisis Estadísticos de los Datos Simulados...........................................................13

Prueba de Medias...........................................................................................13

Prueba de Varianza..........................................................................................13

Estimación del intervalo de una media poblacional.................................................16

Conclusión................................................................................................................24

Referencias...............................................................................................................25

3

Introducción

La simulación es una herramienta para evaluar el desempeño de un sistema

existente o propuesto, bajo diferentes configuraciones de interés. Así como la

eliminación de cuellos de botella en líneas de ensamble, la reducción de fallas al no

conocer especificaciones, la prevención en la sobre utilización de recursos, al igual

que la optimización del desempeño del sistema.

En un estudio de simulación, la intervención humana es requerida en todos los

estados del desarrollo del modelo, así como la experimentación, diseño, análisis de

salidas, formulación de conclusiones y toma de decisiones que alteren el sistema

bajo estudio. El único estado en donde la intervención humana no es requerida es en

la corrida de la simulación, con la existencia hoy en día de paquetes de software de

simulación bastante poderosos y eficientes.

Por lo tanto, la formulación del problema, la experimentación el desarrollo de

modelos de simulación así como el análisis, son indispensables para un exitoso

estudio de simulación.

. Las salidas del modelo de simulación se consideran muestras. Las

principales cuestiones en la obtención de estimaciones útiles a partir de muestras

son: que la muestra sea representativa del comportamiento del sistema, y que el

tamaño de la muestra sea lo suficientemente grande para que las estimaciones de

las medidas de ejecución alcancen un buen nivel de precisión. El tamaño de la

muestra es algo que está bien definido, pero la representatividad del comportamiento

4

del sistema depende de la naturaleza de las cuestiones que tienen que ser

contestadas por el modelo.

Se pueden realizar dos tipos de análisis con un modelo de simulación:

Análisis para sistemas con final definido: la ejecución del modelo finaliza

cuando ocurre un evento específico. Se tomaría una muestra por ejecución.

Análisis para sistemas con final no definido (sistemas en estado de equilibrio

o estacionario): el interés está en medias de las medidas de comportamiento de

ejecuciones largas, después de que el sistema ha pasado por algún periodo de

comportamiento transitorio. Las medidas en estado estacionario se pueden definir

como el valor de las medidas en el límite, cuando la longitud de la ejecución tiende a

infinito.

5

Calculo de número de corridas.

Debido a la naturaleza probabilística de los sistemas donde se utiliza la

simulación, se hace imprescindible crear modelos cuyos resultados sean

estadísticamente iguales a los sistemas reales. Uno de los factores que afectan en

forma directa estos resultados es el tamaño de la corrida de simulación o bien el

número de corridas de simulación realizadas para encontrar resultados confiables. Al

realizar una corrida de simulación el resultado promedio de las variables del sistema

tienen un período de inestabilidad y, conforme transcurre el tiempo, esas variables

tienden a un estado estable y es entonces cuando los valores de las variables de

respuesta son confiables. Existen, en general, varias formas para lograr la

estabilización de un modelo de simulación, la primera consiste en utilizar corridas lo

suficientemente largas para que los datos del período de transición resulten

insignificantes, este planteamiento puede ser adecuado si la ejecución del modelo es

rápida. Esta situación no es tan atractiva si la duración del período transitorio es

prolongado, en este caso, se pueden seleccionar condiciones iniciales de arranque

que sean más representativas de la condición de estado estable y que por tanto

reduzca el período transitorio.

El principal problema en este caso es no tener una idea adecuada de las

condiciones iniciales, lo que podría llevar a una polarización de los resultados y en

consecuencia aumentar la varianza, ocasionando tamaños de corrida más grandes.

Una tercera opción es determinar en qué momento se ha llegado al estado estable en

función de los resultados obtenidos, una de las formas más comunes de determinar

6

este momento se consigue graficando el valor promedio dela variable de interés

contra el tiempo de simulación, y cuando se observe que ese promedio ya no cambia

a través del tiempo, detener la corrida de simulación.

El tamaño de una corrida de simulación depende principalmente del tipo de

distribución que se intenta simular y, por decirlo de alguna forma, de la bondad del

generador de números U(0,1) que se está utilizando y de las condiciones iniciales

con que inició la simulación del sistema. En forma general. Para calcular el número

de simulaciones se tiene la expresión:

Cuando la media y la variancia de la distribución a simular se obtuvieron de

una población 𝑛1 de 30 o menos elementos, entonces, el cálculo óptimo de las

simulaciones se modifica de acuerdo con la siguiente ecuación:

7

Esta segunda fórmula se emplea para calcular n óptima basándose en una

corrida simulada del sistema de tamaño 𝑛1. A esta corrida pequeña se le conoce

como prueba piloto, y su función es calcular n en función de la distribución general y

del generador utilizado en la prueba piloto. Pueden usarse ambas fórmulas siempre

y cuando la información de donde se obtienen los estimadores siga,

estadísticamente, una distribución normal. En caso de que los datos analizados sigan

otra distribución se debe hacer uso del teorema de Tchebycheff de tal suerte que el

cálculo se ve reducido a:

El cálculo del número de corridas óptimo, del modelo de simulación en donde

se tengan varias variables probabilísticas, se realiza ejecutando el cálculo para cada

una de ellas y se selecciona la mayor de todas las n; éste será el número de

simulaciones del modelo computacional.

Ejemplo:

Se desea encontrar el número de simulaciones que debe realizar un simulador

de desperdicios de una planta de poliéster, de tal forma que el promedio diario

simulado de desperdicio no difiera más de ± 0.166 σ de su valor real, con una

confiabilidad del 95%.Si se supone o se sabe que el desperdicio diario en toneladas

sigue una distribución normal, entonces, el número de simulaciones óptimo es:

8

Donde:

Z = 1.96 para una confiabilidad del 95%

K = 0.166s = 0.166σ

Sustituyendo la información:

n = 139.4

Ahora bien, si no se tiene idea de la distribución de probabilidad del desperdicio

de la planta o de que siga otro tipo de distribución, se utiliza la expresión:

}

Este cálculo del número de simulaciones óptimo, es un cálculo a priori, sin

embargo, no se asegura del todo que se cumpla con las condiciones de estabilidad.

Una forma más segura de determinar el momento en que el sistema se

estabiliza se consigue al graficar, a través del tiempo, cada uno de los valores

promedio de aquellas variables o resultados que se deseen analizar y al observar el

comportamiento de las variables deteniendo las simulación cuando todas esas

variables se encuentren en estado estable.

Cálculo de Número de Corridas.

Para calcular el número de corridas, se hace referencia a seguir los siguientes pasos:

9

Paso 1: Clasificar cada número aleatorio con respecto al anterior siguiendo las

siguientes características.

Paso 2: Calcular el número de corridas observadas h. Una corrida se forma por un

conjunto de números aleatorios consecutivos del mismo signo

Paso 3: Calcular E(h) y V(h) siguiendo las formulas; Siendo n el número de datos

generados.

Paso 4: Calcular el estadístico si es menor que el valor critico se acepta la hipótesis

de independencia

10

De acuerdo a lo expresado por E. Garcia, H. Garcia y L. Cardenas (2006) existen dos

versiones de la prueba de corridas: la prueba de corridas arriba y abajo y la prueba

de corridas arriba y abajo de la media.

La Prueba de corridas arriba y abajo consiste en determinar una secuencia de

números (S) que solo contiene unos y ceros, de acuerdo a una comparación entre 𝑟𝑗

y 𝑟𝑗-1. Posteriormente se determina el número de corridas observadas, 𝐶0 (una

corrida se identifica como la cantidad de unos o ceros consecutivos). Luego se calcula

el valor esperado, la varianza del número de corridas y el estadístico 𝑍0 mediante las

ecuaciones:

Si el estadístico 𝑍0 es mayor que el valor crítico, se concluye que los números del

conjunto rj no son independientes. De lo contrario no se puede rechazar que el

conjunto 𝑟𝑗 sea independiente.

Para las Prueba de corridas arriba y abajo de la media, su procedimiento consiste en

determinar una secuencia de unos y ceros, de acuerdo con una comparación entre

los números del conjunto 𝑟𝑗 y 0.5. Posteriormente se determina el número de corridas

observadas, 𝐶0, y los valores de 𝑛0 y 𝑛1. 𝐶0 es el número de corridas en la secuencia,

determinado de la misma manera que en la prueba de corridas arriba y abajo; 𝑛0 es

11

igual a la cantidad de ceros en la secuencia, y 𝑛1 es igual a la cantidad de unos de la

secuencia, cumpliéndose que 𝑛0 + 𝑛1=n. Luego se calcula el valor esperado, la

varianza del número de corridas y el estadístico 𝑍0 con las siguientes ecuaciones:

Si el estadístico 𝑍0 esta fuera del intervalo: −𝑍α/2 𝑍0 𝑍α/2 , se concluye que los

números del conjunto 𝑟𝑗 no son independientes. De lo contrario no se puede rechazar

que el conjunto de 𝑟𝑗 es independiente.

Contadores de Estadísticas Sumarias

Estadística Sumaria: Podemos usar una serie de números conocidos como

estadística sumaria para describir las características del conjunto de datos. Dos de

estas características son de particular importancia para los responsables de tomar

decisiones: la de tendencia central y la de dispersión.

Tendencia central: la tendencia central se refiere al punto medio de una distribución.

Las medidas de tendencia central se conocen como medidas de posición.

12

Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al

grado en que las observaciones se distribuyen.

Sesgo: las curvas que representan los puntos de datos de un conjunto de datos

pueden ser simétricas o sesgadas. Las curvas simétricas, tienen una forma tal que

una línea vertical que pase por el punto más alto de la curva dividirá el área de esta

en dos partes iguales. Cada parte es una imagen espejo de la otra.

En las curvas sesgadas, los valores de su distribución de frecuencias están

concentrados en el extremo inferior o en el superior de la escala de medición del eje

horizontal. Los valores no están igualmente distribuidos. Las curvas pueden estar

sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda

(negativamente sesgadas).

Curtosis: cuando medimos la curtosis de una distribución, estamos midiendo

Su grado de agudeza.

Principio Fundamental del Proceso de Conteo

Hipótesis: Un evento puede realizarse de n1 maneras, un segundo de n2 maneras

y un k-esimo evento de nk maneras.

Conclusión: El número de maneras en que puede suceder una sucesión de los k

eventos en el orden indicado es de: n1*n2*...*nk

Demostración: Por inducción sobre el número de eventos tenemos que para el

primer evento, tenemos n1 formas de hacerlo y no hay nada que probar. Supongamos

13

que para k-1 eventos el número de maneras en que suceden es n1n2...nk-1 entonces,

para los k eventos, tenemos que para cada uno de los nk eventos tenemos n1n2...nk-

1 maneras de realizarlos, por lo que existen n1n2...nk formas de que los eventos

sucedan, por lo tanto queda probado el principio fundamental de conteo.

Análisis Estadísticos de los Datos Simulados: medida y varianza

maestral

Por lo regular, los estudios de simulación se realizan para determinar el valor de

cierta cantidad θ, en este caso se refiere a determinar las medidas de rendimiento,

relacionada con un modelo estocástico particular. La simulación del sistema en

estudio produce datos de salida que son, variables aleatorias cuyo valor esperado

es precisamente el valor buscado θ, es decir el valor

de la medida de rendimiento considerada. Una simulación independiente, vale decir,

otra ejecución de la simulación, proporciona una nueva variable aleatoria

independiente de la anterior, pero con la misma media. Esto continúa hasta obtener

k ejecuciones o réplicas y k variables aleatorias independientes, todas ellas con la

misma distribución y media θ, cuyo promedio sirve como estimador de θ, es decir,

sirve como estimador de la medida de rendimiento estudiada.

Prueba de Media: La media o promedio muestral “X(n)” es el promedio simple de

los datos la cual consiste en verificar que los números generados tengan

una media estadísticamente igual a , de esta manera, se analiza la siguiente

hipótesis:

14

Paso 1: Calcular la media de los n números generados.

Paso 2: Calcular los límites superior e inferior de aceptación:

Paso 3:

Si el valor de se encuentra entre y aceptamos que los números

tienen una media estadísticamente igual a con un nivel de aceptación

Prueba de Varianza: Se puede definir como el "casi promedio" de los cuadrados de

las desviaciones de los datos con respecto a la media maestral. Consiste en verificar

si los números aleatorios generados tienen una varianza de 0.083, de tal forma que

la hipótesis queda expresada como:

15

Paso 1: Para calcular la varianza de los n números generados V(x), usamos la

fórmula matemática de datos referentes a una muestra.

Y para el caso de datos de una población es dada por

Paso 2: Calcular los límites superior e inferior de aceptación.

Paso 3:

Si V(x) se encuentra entre los valores de y , aceptamos la

hipótesis nula y los números aleatorios tienen una varianza estadísticamente igual

16

Según Sheldon (2007) la varianza muestral se define como la "medida" de

los cuadrados de las desviaciones a la media muestral (...) La varianza muestral

denotada por s2 de los datos xi...xn con media se define como:

La media muestral es considerada por el mismo autor como la media

aritmética de los valores de datos. La media muestral denotada por , se define

por:

17

Estimación del intervalo de una media poblacional

La estimación es el conjunto de técnicas que permiten dar un valor aproximado

de un parámetro de una población a partir de los datos proporcionados por una

muestra. Por ejemplo, una estimación de la media de una determinada característica

de una población de tamaño N podría ser la media de esa misma característica para

una muestra de tamaño n.1. La estimación puede ser de dos tipos por intervalos o

puntual

Una ventaja de la estimación por intervalo es que muestra la exactitud con que

estima el parámetro, a menor longitud del intervalo mayor exactitud en la estimación.

Un intervalo de confianza es un rango de valores, centrado en una media muestral

X¯, dentro del cual se espera que con un nivel de confianza (1 − α) se encuentre el

valor del parámetro en cuestión. Los métodos de estimación por intervalo son el

método pivotal y el método general.

La estimación por intervalo consiste en la obtención de un intervalo dentro del

cual estará el valor del parámetro estimado con una cierta probabilidad. En la

estimación por intervalos se usan los siguientes conceptos:

Intervalo de confianza

El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es

el parámetro a estimar. Este intervalo contiene al parámetro estimado con un

determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando

la muestra no garantiza un axioma o un equivalente circunstancial.

Variabilidad del Parámetro

Si no se conoce, puede obtenerse una aproximación en los datos aportados por la

literatura científica o en un estudio piloto. También hay métodos para calcular el

18

tamaño de la muestra que prescinden de este aspecto. Habitualmente se usa como

medida de esta variabilidad la desviación típica poblacional y se denota σ.

Error de la estimación

Es una medida de su precisión que se corresponde con la amplitud del intervalo de

confianza. Cuanta más precisión se desee en la estimación de un parámetro, más

estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el

error, más observaciones deberán incluirse en la muestra estudiada. En caso de no

incluir nuevas observaciones para la muestra, más error se comete al aumentar la

precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.

Límite de Confianza

Es la probabilidad de que el verdadero valor del parámetro estimado en la población

se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-

α), aunque habitualmente suele expresarse con un porcentaje ((1-α)·100%). Es

habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con

valores α de 0,05 y 0,01 respectivamente.

Valor α

También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar

en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de

confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del 95%,

el valor α es (100-95)/100 = 0,05

Valor crítico

Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución

que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.

Normalmente los valores críticos están tabulados o pueden calcularse en función de

la distribución de la población.

19

La estimación puede hacerse a través del intervalo de confianza, Álvarez (2007)

hace el siguiente señalamiento:

Consiste en calcular dos números entre los cuales se encuentra el valor

del parámetro poblacional que se desee estimar con una determinada

probabilidad. Dichos números son límites de intervalo y se calculan según la

distribución del correspondiente estimador en el muestreo. La probabilidad de que

el valor del parámetro esté entre los límites del intervalo es la confianza de

estimación que suele definirse mediante 1- α; α es el error de estimación, si la

confianza es 0,9, α es 0,1. A los intervalos de estimación también se les denomina

intervalos de confianza (...) En la estimación por intervalo es necesario calcular

dos puntos a los que se denomina: límite inferior Li y límite superior Ls, del

intervalo de confianza (...) En general, se pueden deducir las expresiones

necesarias para el cálculo de los límites del intervalo de confianza a partir de una

expresión similar a la:

En la expresión anterior W es el valor del parámetro poblacional que se desea

estimar, Ŵ es su estimador, C es un valor que depende de la distribución del

estimador en el muestreo (...); EEŴ es el error estándar del estimador Ŵ , 1-α es la

confianza con que se realiza la estimación. A partir de la expresión anterior se

deducen los límites del intervalo:

20

A los estimadores se les suele representar con un acento circunflejo sobre

el parámetro que se desea estimar. Por ejemplo, u es la medida poblacional y û

es su estimador. En el caso de la media aritmética poblacional el estimador más

utilizado es la media aritmética muestral que se representa mediante el símbolo

: û= , la igualdad anterior indica que la media muestral es un estimador de la

media poblacional (...) Para un mismo parámetro suele haber muchos

estimadores posibles, hay que elegir el más eficiente.

La precisión en la estimación aumenta con el tamaño de la muestra, ya que al

aumentar ésta disminuye el error estándar del estimador: con muestras grandes

las estimaciones son más precisas y viceversa.

Según Weiers (2006) refiere el intervalo de estimación como:

Un intervalo de estimación para la medida simplemente describe un rango

de valores que es probable que incluya a la medida real de la población (...) Un

intervalo de confianza llamado también (intervalo de estimación) es aquel en donde

existe un grado específico de certeza de que el valor real del parámetro

poblacional caerá dentro de ese intervalo. Al construir un intervalo de confianza

para la medida, es muy importante tener en cuenta si conocemos o no el valor de la

desviación estándar de la población α (ver Gráfico 1).

21

Gráfico 1. Métodos para determinar las estimaciones de intervalo de confianza

para la medida de una población.

22

(...) Cuando se conoce la estimación del intervalo de confianza para la

medida: α conocida, por lo general en los procesos industriales puede conocerse

α aunque se desconoce u. Si la población no tiene una distribución normal, el

tamaño de la muestra debe ser de al menos 30, para que se aplique el teorema

central del límite. Cuando se cumplen estas condiciones, el intervalo de

confianza para la medida de la población es el siguiente (ver Gráfico 2):

Gráfico 2. Límites del intervalo de confianza para la medida de una

población, con α conocida.

(...) Cuando se desconoce α, pero se puede suponer que la población tiene

una distribución normal , el uso de la distribución t es una necesidad si

n<30. Sin embargo, también es adecuado el uso de la distribución t cuando se

desconoce α y los tamaños de la muestra son más grandes. Casi todos los

paquetes de software para estadística suelen utilizar el intervalo de t para todos

los tamaños de muestra cuando se emplea para estimar α. La estimación

del intervalo se resume del modo siguiente (ver Gráfico 3):

23

Gráfico 3. Límites del intervalo de confianza para la medida de una población,

α desconocida.

Como calcular la media poblacional a través del intervalo de confianza

Ejemplo 1: Queremos saber la media de km recorridos por los taxistas de cierta

población. Sabemos por estudios anteriores que = 2.250 km. Para ello, elegimos

una muestra de 100 taxistas y obtenemos una media muestral x =15.200 km.

a) Determina el intervalo de confianza al 99% para .

b) ¿Cuál ha de ser el tamaño mínimo de la muestra para que el error no supere

los 500 km con la misma confianza del 99%?

Solución:

Puesto que n=100 (30), sabemos que 2.250

, , 225100

X N N

.

) (15.200 15.200 ) 0,99 ( ) 0,99225 225

( ) 0,995 2,575 ( ) 579,225 225

int , 99%, y según esta muestra, [14.621;15.779]

L La P L X L P Z

L LP Z ver tabla L

con lo que el ervalo de confianza para al es

b) Si el I.C. ha de ser [ x -500, x +500], entonces, como 2.250

,X Nn

,

500 500( 500 500) 0,99 0,99

2.250 2250

500 500( ) 0,995 2,575 ( )

2.250 2.250

2,575 2.25011,59 134,32 135

500

P x X x P Z

n n

n nP Z ver tabla

n n n

24

Conclusión

Actualmente se reconoce la importancia de la estadística aplicada en el

desarrollo de investigaciones en diversos campos. Cada vez son más los

profesionales de diferentes disciplinas que requieren de métodos estadísticos como

muestreo, simulación, diseño de experimentos, modelamiento estadístico e

inferencia, para llevar a cabo recolección, compendio y análisis de datos y para su

posterior interpretación

La simulación es una técnica de muestreo estadístico controlado

(experimentación) que se emplea conjuntamente con un modelo, para obtener

respuestas aproximadas a problemas probabilísticos complejos; debe seguir las

normas del diseño de experimentos para que los resultados obtenidos puedan

conducir a interpretaciones significativas de las relaciones de interés. La

construcción y operación de un modelo de simulación permite la observación del

comportamiento dinámico de un sistema en condiciones controladas, pudiéndose

efectuar experimentos para comprobar alguna hipótesis acerca del sistema bajo

estudio.

En el Análisis de las Salidas de Simulación, la recolección y validación de

los datos son factores que no se pueden dejar pasar por alto, debido a éstos suman

un factor importante al proporcionar un resultado óptimo en la salida de la

problemática planteada y mientras más exactos y precisos sean los resultados

obtenidos en cuanto a la cantidad del número de corridas, menor es el margen de

error lo que nos acerca más a la realidad que se quiere representar.

25

Referencias

http://www.unamerida.com/archivospdf/337%20Lectura6.3.2.pdf

http://es.wikipedia.org/wiki/Varianza

http://es.wikipedia.org/wiki/Media_(matem%C3%A1ticas)#Media_muestral

http://www.monografias.com/trabajos91/estimacion-intervalos-

confianza/estimacion-intervalos-confianza.shtml