laboratorio 6 teoria de juegos

20
28-6- 2014 Laboratorio N° 6 Teoría de Juegos ALARCÓN MOROCO, Jhazim Jazmín ZEA DIAZ, Reyna Alejandra CURSO: INVESTIGACIÓN DE OPERACIONES 2 DOCENTE: ING. EFRAÍN MURILLO INTEGRANTES:

Upload: samuel-cordova

Post on 19-Jul-2016

137 views

Category:

Documents


2 download

TRANSCRIPT

28-6-2014

Laboratorio N° 6Teoría de Juegos

ALARCÓN MOROCO, Jhazim Jazmín ZEA DIAZ, Reyna Alejandra

CURSO:

INVESTIGACIÓN DE OPERACIONES 2

DOCENTE:

ING. EFRAÍN MURILLO

INTEGRANTES:

EJERCICIOS PROPUESTOS

1. En el horario de 8 a 9 p.m., Panamericana (PANTEL) y América televisión compiten por la audiencia de 10 millones de espectadores. Semanalmente, las cadenas televisivas deben anunciar en forma simultánea el espectáculo que emitirán en ese horario. Las elecciones posibles de cada cadena y el número de televidentes de Panamericana, en millones, aparecen en la tabla A, para cada elección. Por ejemplo, si ambas cadenas escogen una película de acción, la matriz indica que 3.5 millones escogerán Panamericana y 10 – 3.5 = 6.5 millones verán América. Así tenemos un juego de dos personas con juego constante, con c = 10 (millones).

Tabla A

América Televisión

Película de Acción Telenovela Comedia

Película de Acción 3.5 1.5 6.0Pantel Telenovela 4.5 5.8 5.0 Comedia 3.8 1.4 7.0

a) ¿Tiene este juego un punto de silla?. ¿Cuál es el valor del juego para cada cadena?

América tvPelícula de

acción Telenovela Comedia Min

Pantel

Película de acción 3.5 1.5 6 1.5

Telenovela4.5 5.8 5 4.5 MAX

Comedia 3.8 1.4 7 1.4

Max 4.5 5.8 7MIN

Si tiene un punto de silla en el punto (2,1), pues:

Valor Minimax=Valor Maximin4.5=4.5

Y el valor del juego es 4,5

b) ¿Qué Cadena es la ganadora del juego?

El resultado anterior indicaría que Pantel debería elegir en el horario de 8:00 a 9:00 am la estrategia de emitir una telenovela, con lo que se quedaría con 4.5 millones de televidentes, mientras que América TV optaría por emitir una película de acción, y se quedaría con el resto de televidentes (10-4.5) que seria 5.5 millones de televidentes. Por esta razón la cadena televisiva ganadora del juego seria América TV, pues esta cadena se quedaría con la mayor cantidad de televidentes.

c) ¿Qué estrategia debe aplicar cada cadena televisiva?

Como este problema tiene punto de silla, solo requiere la aplicación de estrategias puras, en este caso:Pantel:

Po = 0 1 0

América TV:Qo = 1

00

Pues si aplicamos la relación V=Po∗A∗Qo

V = 0 1 0 3.5 1.5 6 14.5 5.8 5 03.8 1.4 7 0

V=4.5

d) ¿En un año cuántas semanas debe aplicar cada estrategia cada cadena?

En un año Pantel debe aplicar 52 semanas la estrategia de transmitir en el horario de 8:00 a 9:00 am una telenovela.En un año América TV debe aplicar 52 semanas la estrategia de transmitir en el horario de 8:00 a 9:00 am una película de acción.

e) ¿Cuántos televidentes atrae más la cadena televisiva ganadora?

La cadena televisiva América TV se queda con 5.5 millones de televidentes, y Pantel con 4.5 millones de televidentes, la diferencia de estas dos cifras es: 5.5−4.5=1 millón de televidentes

Respuesta.-Un millón de televidentes atrae más la cadena televisiva ganadora que es América TV

f) Para el problema anterior, Si Pantel Ofrece Telenovela y América Televisión ofrece Película de Acción, entonces Pantel gana 6 millones de espectadores. ¿Cuáles serán las nuevas respuestas?

------> Las nuevas respuestas serian:

a) ¿Tiene este juego un punto de silla? ¿Cuál es el valor del juego para cada cadena?

La nueva matriz seria:

América tvPelícula de

acción Telenovela Comedia Min

PantelPelícula de

acción 3.5 1.5 6 1.5

Telenovela 6 5.8 5 5 MAXComedia 3.8 1.4 7 1.4

Max 6 5.8 7MIN

Este nuevo juego no tendría un punto de silla pues: Valor Minimax≠Valor Maximin

5≠5.8

El nuevo valor de juego para este juego usando el LINDO: Primero hallamos el modelo matemático para Pantel:

Max vSt :3.5 x1+6 x 2+3.8 x 3≥v1.5 x1+5.8 x2+1.4 x 3≥v6 x1+5 x 2+7 x 3≥vx1+x 2+ x3=1X 1 , x 2 , x 3≥0

Respuesta.- El nuevo valor para este juego es 5.25

b) ¿Qué Cadena es la ganadora del juego?

Respuesta.- El resultado anterior indicaría que Pantel debería elegir en el horario de 8:00 a 9:00 am la estrategia de emitir una telenovela el 87.5% de las veces y la estrategia de emitir una comedia en un 12.5% de las veces, mientras que América TV optaría por emitir una telenovela el 31.25% de las veces y la estrategia de emitir una comedia en un 68.75% de las veces. Al final del juego Pantel ganara 5.25 valor que representa su ganancia máxima.Al final del juego America TV ganara 5.25 valor que representa su Perdida mínima

Del mismo modo ninguna de las dos cadenas televisivas debe elegir la estrategia de emitir una película de acción.

c) ¿Qué estrategia debe aplicar cada cadena televisiva?

Del resultado anterior se puede saber que la estrategia para Pantel deberá ser:

Po = 0 0.875 0.125

Y la estrategia para América TV deberá ser:Qo = 0

0.31250.6875

d) ¿En un año cuántas semanas debe aplicar cada estrategia cada cadena?

En un año Pantel debe aplicar 46 semanas la estrategia de transmitir en el horario de 8:00 a 9:00 am una telenovela y 6 semanas transmitir una comedia.En un año Pantel debe aplicar 16 semanas la estrategia de transmitir en el horario de 8:00 a 9:00 am una telenovela y 36 semanas transmitir una comedia.

2. Dado el juego bipersonal de suma nula con matriz de pagos:

[ 6 −2 1 2−1 0 −2 −10 3 1 34 −3 0 1 ]

a) Obtenga la estrategia óptima para ambos jugadores y el valor del juego, interpretando los resultados obtenidos.

Sea la matriz:

Jugador B

a b c d

Jugador A

a 6 -2 1 2

b -1 0 -2 -1

c 0 3 1 3

d 4 -3 0 1

Planteamos en modelo matemático:Max vSt6 x1−x2+0 x3+4 x 4≥v−2 x1+0 x2+3 x−34 x 4≥v1 x1−2 x2+1 x3+0x 4≥v2 x1−1 x2+3 x3+1x 4≥vX 1+x2+x 3+x 4=1X 1 , x 2 , x 3 , x 4≥0

Resolviendo por el LINDO

El valor de este Juego es: 1

Del resultado anterior se puede saber que la estrategia para el Jugador A deberá ser: Po = 0.4 0 0.6 0

Y la estrategia para el Jugador B deberá ser:Qo = 0

010

b) Obtenga el resultado esperado del juego si el jugador A opta por su estrategia p=[1/6, 0, 5/6, 0] y el jugador B adopta su estrategia q= [1/2, 0, ½, 0]. Interprete el resultado obtenido.

Si aplicamos la relación V=Po∗A∗Qo

V= 0.16667 0 0.83 0 6 -2 1 2 0.5

-1 0 -2 -1 0

0 3 1 3 0.5

4 -3 0 1 0

V= 1 2.167 1 2.8333

V= 1

Como se aprecia el valor del Juego no cambia y sigue siendo:1

c) Obtenga la estrategia que deberá aplicar el jugador A y el resultado esperado del juego, si el jugador B adopta su estrategia q= [0.4, 0, 0.6, 0]. Interprete el resultado obtenido.

Si el jugador B cambia su estrategia este va ha mejorar su resultado (v>= 1), siempre y cuando el jugador A replantee su estrategia buscando maximizar su ganancia

Entonces: V ≥1

Po∗A∗Qo ≥ 1

x1 x2 x3 x4 6 -2 1 2 0.4

-1 0 -2 -1 0>= 1

0 3 1 3 0.6

4 -3 0 1 0

Por lo tanto el modelo matemático del jugador A será:

Max 3 x1−1.6x 2+0.6 x3+1.6 x 4ST:

3 x1−1.6x 2+0.6 x3+1.6 x 4

x1+x 2+ x3+x 4=1

Resolviendo en el LINDO

Por lo tanto la estrategia que debera aplicar el Jugador A sera:

Po = 1 0 0 0

Así también el nuevo valor del juego es 3.

3. Encuentre las estrategias óptimas y el valor del juego para cada uno de los juegos siguientes. Los pagos son para el jugador A.

I.

Como este juego no tiene punto de silla, entonces plantearemos el modelo matemático:Max vSt :8 x1+8 x 2+7 x3≥v6 x1+9x 2+5 x 3≥v2 x1+9 x2+3 x 3≥v8 x1+5 x2+5 x 3≥vx1+x 2+ x3+x 4=1x1 , x2 , x3 , x 4≥0 A través del LINDO:

B

1 2 3 4

1 8 6 2 8

A 2 8 9 9 5

3 7 5 3 5

Del resultado anterior se puede saber que la estrategia para el Jugador A deberá ser:

Po = 0 0.4 0.6 0

Y la estrategia para el Jugador B deberá ser:Qo = 0

00.30.7

Y el valor del juego es 6.2

II. B1 2 3 4 Min

1 4 -4 -5 6 -5 MAX

A 2 -3 -4 -9 -2 -93 6 7 -8 -9 -94 7 3 -9 5 -9

Max 7 7 -5 6MIN

Este juego si tiene un punto de silla en el punto (1,3), pues:

Valor Minimax=Valor Maximin−5=−5

Y el valor del juego es -5

4. Encuentre el intervalo de valores para “p” y “q” que harán el elemento (2,2) un punto de silla en los juegos siguientes:

B B

1 q 6 2 4 5A p 5 10 A 1 7 q 6 2 3 4 p 6

1er JuegoB Min

1 q 6 1 ó qA p 5 10 5 Max 5< p

6 2 3 2Max 6 ó p 5 10

Min5>q

Valores de p y q:

p∈¿5 ,∞+¿q∈ ¿−∞,5¿

2do JuegoB Min

2 4 5 2A 1 7 q 7 Max 7<q

4 p 6 4 ó pMax 4 7 6 ó q

Min7> p

Valores de p y q: El elemento (2,2) en el 2do juego no puede ser punto de silla ya que el MINIMAX=4 y para que lo sea 7, este último debe ser menor a 4.

5. Dos grandes cadenas de supermercados, que llamaremos A y B respectivamente, van a inaugurar, en las mismas fechas, un nuevo supermercado en un centro comercial de una ciudad en la que el número de clientes potenciales es de 100,000. El reparto del número de clientes potenciales entre las dos cadenas depende de la estrategia que cada una de las firmas adopte en cuanto a campañas de

publicidad y productos en oferta. En función de la estrategia seguida por cada empresa, el número de clientes potenciales que se adjudica a la cadena A, en miles es el siguiente:

B1 B2 B3

A1 40 10 60A2 50 30 70A3 60 20 80A4 25 35 50

a) Formule el modelo matemático que deberá aplicar la cadena B para optimizar su resultado.

Min W

St

40Y1+10Y2+60Y3<=W50Y1+30Y2+70Y3<=W60Y1+20Y2+80Y3<=W25Y1+35Y2+50Y3<=WY1+Y2+Y3=1Y1, Y2, Y3>=0

b) Utilizando la salida del WinQSB, Determine las estrategias óptimas, así como el número mínimo de clientes que aceptará tener A? ¿Y B?

Resolviendo el modelo matemático anterior en WinQSB tenemos:

El valor del juego es 33.33

La estrategia óptima para A y B respectivamente es:

p0= [0 0.33 0 0.67 ]

q0=[0.170.83

0 ]Los clientes mínimos que aceptará tener A y B respectivamente es:

p0∗100000=[ 0 0.33 0 0.67 ]∗100000= [0 33333 066667 ]

q0∗100000=[0.170.83

0 ]∗100000=[1666783333

0 ]c) Formule el modelo matemático que deberá aplicar la cadena B, si la cadena A opta por la

estrategia [0.4 0.3 0.2 0.1].

Min [ 0.4 0.3 0.20.1 ]∗[40 1050 30

6070

60 2025 35

8050 ]∗[Y 1

Y 2Y 3 ]

St

[ 0.4 0.3 0.20.1 ]∗[40 1050 30

6070

60 2025 35

8050 ]∗[Y 1

Y 2Y 3 ]≤33.33

Y 1+Y 2+Y 3=1

Y 1 ,Y 2 ,Y 3≥0

Reduciendo el modelo matemático queda:

Min 45.5Y 1+20.5Y 2+66Y 3

St

45.5Y 1+20.5Y 2+66Y 3≤33.33

Y 1+Y 2+Y 3=1

Y 1 ,Y 2 ,Y 3≥0

Mediante WinQSB resulta:

q0=[Y 1Y 2Y 3]=[010 ]

Rpta.: A “B” le conviene aplicar siempre la 2da estrategia si la cadena A opta por la estrategia [0.4 0.3 0.2 0.1]

6. Pablo ha pasado la tarde en un salón de juegos observando cómo uno de los empleados juega al mentiroso y cómo juegan en otra mesa a una variación de las tres en raya. En el juego del mentiroso, la “casa” tiene tres posibles alternativas: pasar, decir la verdad o mentir (alternativas que vamos a llamar B1, B2 y B3, mientras que Pablo sólo tiene dos posibilidades: decir la verdad o mentir (A1 y A2). Según se combinen estas opciones las posibles ganancias para el jugador quedan recogidas en la siguiente tabla:

B1 B2 B3A1 8 3 1A2 0 1 2

En el otro juego observa que, tanto el jugador (a quien seguiremos llamando A) como la “casa” (jugador C) tiene tres posibles estrategias: intentar conseguir las tres en raya en fila, conseguirlo en columna o conseguirlo en diagonal. Dependiendo de las estrategias adoptadas por los contrincantes, los posibles resultados son:

C1 C2 C3A1 1 -1 3A2 7 4 6A3 3 -2 5

a) ¿Cómo debe jugar Pablo al mentiroso o a las tres en raya de forma óptima, si su comportamiento racional es prudente?

Juego del mentiroso

Max V

St

8 X 1≥V

3 X 1+X 2≥VX 1+2 X 2≥V

X 1+X 2=1X 1 , X2≥0

Resolviendo en el WinQSB resulta:

Valor del juego: 1.67

Jugador→ p 0=[ 0.33 0.67 ]

Casa→q 0=[ 00.330.67]

Rpta: El jugador (Pablo) debe decir la verdad el 33% de las veces y el restante 67% mentir.

Juego del tres en raya

C1 C2 C3 MinA1 1 -1 3 -1A2 7 4 6 4 MaxA3 3 -2 5 -2

Max 7 4 6Min

Maxmin=Minmax

Punto de silla=4

Valor del juego: 4

Por lo tanto:

Jugador→p 0=[ 0 1 0 ]

Casa→q 0=[010]Rpta: Tanto el jugador como la casa deben elegir la 2da estrategia siempre.

b) Si en el juego del mentiroso Pablo aplica la estrategia empírica [0.5 0.5], ¿Qué alternativa de mejora le recomendaría Ud. A la “casa”?.

Min [ 0.5 0.5 ]∗[8 3 10 1 2]∗[Y 1

Y 2Y 3 ]

St

[ 0.5 0.5 ]∗[8 3 10 1 2]∗[Y 1

Y 2Y 3 ]≤1.67

Y 1+Y 2+Y 3=1

Y 1 ,Y 2 ,Y 3≥0

Reduciendo el modelo matemático queda:

Min 4 Y 1+2Y 2+1.5Y 3St

4 Y 1+2Y 2+1.5Y 3≤1.67

Y 1+Y 2+Y 3=1

Y 1 ,Y 2 ,Y 3≥0

Mediante WinQSB resulta:

q0=[Y 1Y 2Y 3]=[001 ]

Rpta.: A la “Casa” le conviene aplicar siempre la 3ra estrategia si el jugador opta por la estrategia [ 0.5 0.5 ].