segura 2013 -- juegos de suma cero - v1

90
Teoría de los Juegos // @JackFlash Teoría de los Juegos: Juegos de Suma Cero Una Introducción J.C.Segura Ms.Sc. Universidad de La Salle Facultad de Ciencias Económicas y Sociales Escuela Colombiana de Ingeniería Facultad de Economía Bogotá, D.C., Enero de 2013

Upload: juan-segura

Post on 18-Dec-2014

2.192 views

Category:

Education


2 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Teoría de los Juegos: Juegos de Suma Cero Una Introducción

J.C.Segura Ms.Sc.

Universidad de La Salle Facultad de Ciencias Económicas y Sociales

Escuela Colombiana de Ingeniería

Facultad de Economía

Bogotá, D.C., Enero de 2013

Page 2: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Una Escena de “A Beautiful Mind” (2001)

¿Adoptamos solución de Mano Invisible, i.e., cada uno va a la suya por la rubia, —enfrentando una más que probable derrota—, o cooperamos, la ignoramos y

vamos por sus amigas, con una ganancia no negativa para cada uno de nosotros?

Vea esta escena en: http://www.youtube.com/watch?v=IcTHiS7hQnI

Page 3: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Motivación � En los primeros cursos de microeconomía se han tratado problemas

concernientes a una única unidad de decisión: consumidor y productor eligen planes de consumo y de producción de entre sus conjuntos factibles para optimizar una cierta función objetivo.

� En dichos modelos, el individuo reacciona ante cambios en los parámetros que delimitan su ambiente pero (y mucho menos en forma estratégica) no ante otros individuos. El Supuesto céteris páribus del análisis Marshalliano supone demasiado acerca del mundo real.

� En la práctica agentes, -consumidores, productores, gobiernos- interactúan entre si y adoptan conductas estratégicas unos respecto de la conducta de otros.

Page 4: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Motivación

En algunos casos es razonable asumir que el individuo no reacciona dada su estimación de lo que otros individuos van a hacer, sino que decide actuar dado el valor de alguna estadística agregada que varía en menor proporción con la elección de un individuo. En estos casos constituye una razonable estrategia de modelamiento representar a los agentes decisores como unos individuos que toman como dado el valor de una cierta variable agregada. La principal aproximación de este enfoque es la Teoría del Equilibrio General

Page 5: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Motivación

En la Teoría de las Interacciones o teoría de los Juegos, por el contrario, introduciremos el estudio de las interacciones racionales entre individuos que quieren mejorar sus condiciones, a través de la aplicación de decisiones estratégicas.

Page 6: Segura   2013 -- juegos de suma cero - v1

Motivación Aún cuando los antecedentes de la Teoría Clásica de las Decisiones Estratégicas, o Teoría Clásica de los Juegos se remontan a A.A.Cournot (1838) y a F.Y.Edgeworth logra una primera formalización de la materia

1 En Hillas et. al. se ofrece la crónica del desarrollo de la Teoría de los Juegos de Paul Walker:

Teoría de los Juegos // @JackFlash

Aún cuando los antecedentes de la Teoría Clásica de las Decisiones Estratégicas, o Teoría Clásica de los Juegos se remontan a A.A.Cournot (1838) y a F.Y.Edgeworth (1881), no es sino hasta 1944 cuando se logra una primera formalización de la materia1.

En Hillas et. al. se ofrece la crónica del desarrollo de la Teoría de los Juegos de Paul Walker: http://www.econ.canterbury.ac.nz/personal_pa

Teoría de los Juegos // @JackFlash

Aún cuando los antecedentes de la Teoría Clásica de las Decisiones Estratégicas, o Teoría Clásica de los Juegos se remontan a A.A.Cournot

sino hasta 1944 cuando se

http://www.econ.canterbury.ac.nz/personal_pages/paul_walker/gt/hist.htm

Page 7: Segura   2013 -- juegos de suma cero - v1

Motivación La Teoría de los Juegos solo llegó a conformarse como un cuerpo disciplinario y científico coherente tras la publicación, en 1944 Theory of Games and Economic BehaviorNeumann y del economista austriaco Oskar Morgenstern.

Teoría de los Juegos // @JackFlash

La Teoría de los Juegos solo llegó a conformarse como un cuerpo disciplinario y científico coherente tras la publicación, en 1944 Theory of Games and Economic Behavior del matemático húngaro John von Neumann y del economista austriaco Oskar Morgenstern.

Teoría de los Juegos // @JackFlash

La Teoría de los Juegos solo llegó a conformarse como un cuerpo disciplinario y científico coherente tras la publicación, en 1944 de la

del matemático húngaro John von Neumann y del economista austriaco Oskar Morgenstern.

Page 8: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Motivación En 1928 Von Neumann reportó ante la Sociedad Matemática de Göttingen el hallazgo de una estrategia racional para elegir en el lanzamiento de una moneda al aire. La prueba de Von Neumann se podía extender a otros juegos como el ajedrez y algunos juegos de cartas y mostraba que, para cada caso, existía un mejor método posible de juego que se podía determinar matemáticamente. La “mejor estrategia posible” es aquella que garantiza al jugador la máxima ventaja sin importar las respuestas de los competidores. Morgenstern entendió con claridad que los agentes debían comprender la naturaleza interactiva de la economía y que sus decisiones deben estar contextualizadas en el ambiente prevalente. En 1930 Morgenstern y Von Neumann inician una colaboración que hizo de la Teoría de los Juegos una verdadera disciplina científica.

Page 9: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Juegos No Cooperativos con Información Simétrica Los juegos de Von Neumann y Morgenstern presentan varios elementos comunes:

• Hay un número finito, N de jugadores y cada uno tiene un conjunto finito S de estrategias para jugar;

• El juego comprende un número finito de etapas o movidas; • Al terminar el juego se asigna un pago numérico a cada jugador que es a su

turno la suma ponderada de los pagos recibidos en cada una de las etapas precedentes;

• La naturaleza puede mutar: las decisiones de los jugadores pueden ser aleatorias; • La información sobre las opciones de juego, estrategias, reglas y pagos es pública:

cada jugador tiene conocimiento completo y simétrico de las reglas del juego.

Page 10: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Representación de un Juego

Hay varias formas de describir un juego. La forma extensiva presenta una descripción “extensa” de un juego. En contraste, la forma estratégica presenta un resumen reducido de las dimensiones de un juego particular. Definición 1. Un juego finito en forma estratégica es una tupla ��, �, �� en la cual: � � = �1,2, ⋯ , �, ⋯ , � es el conjunto de jugadores; � � = �� × �� × ⋯ × �� × ⋯ × �� es el conjunto de perfiles de

estrategias puras, y � � = ��, ⋯ , ��, ⋯ , �� siendo ��: � → ℝ la función de beneficio

o utilidad del n-ésimo individuo.

Page 11: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Juegos en Forma Estratégica (Normal) La anterior especificación implica entonces la definición de un conjunto de jugadores numerados de 1 hasta N. Para cada uno de los N jugadores se ha especificado a su vez un número finito de acciones o estrategias que éste puede adoptar, y se ha notado con��. El producto cartesiano de estos conjuntos se ha notado a su vez con �. Como consecuencia, un elemento típico del conjunto S es � = ���, ��, ⋯ , �� en el que cada sn es una estrategia pura del jugador �, esto es, un elemento de Sn. El conjunto s es un perfil de estrategias puras. Para cada jugador también se ha definido una función ��: � → ℝ que representa el pago correspondiente a un perfil de estrategia definido.

Page 12: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Para N = 2 jugadores, S = (s1, s2) estrategias disponibles con funciones de pago u1, u2 que dependen tanto de sus acciones individuales como de las acciones de su contendor, es posible resumir un juego mediante una bimatriz como la siguiente:

1 2 1 2 1 2 1 2 1 211 11 12 12 13 13 1 1 1 11 2 1 2 1 2 1 2 1 221 21 22 22 23 23 2 2 2 21 2 1 2 1 2 1 2 1 231 31 32 32 33 33 3 3 3 3

1 2 1 2 1 2 1 2 11 1 2 2 3 3

1 2 3

1 , , , , ,

2 , , , , ,

3 , , , , ,

, , , ,

j j n n

j j n n

j j n n

i i i i i i ij ij in

j n

u u u u u u u u u u

u u u u u u u u u u

u u u u u u u u u u

i u u u u u u u u u

L L

L L

L L

L L

M M M M O M O M

2

1 2 1 2 1 2 1 2 1 21 1 2 2 3 3

,

, , , , ,

in

m m m m m m mj mj mn mn

u

m u u u u u u u u u u

M M M M M M M M

L L

Juga

dor 1

Page 13: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Donde �� = �1,2, � , � y �� � �1,2, � , � son estretégias puras para los jugadores 1 y 2 respectivamente, y ���

� son los pagos del jugador � cuando juega � y cuando el otro jugador juega �. Si dichos pagos son tales que ���

� � ���� , es decir, si ���

� � ���� � 0 se dice que se

trata de un juego de suma cero. La Matriz de pagos se pueden entonces resumir registrando la ganancia del jugador 1, por ejemplo:

11 12 13 1 1

21 22 23 2 2

31 32 33 3 3

1 2 3

1 2 3

1 2 3

1

2

3

j n

j n

j n

i i i ij in

m m m mj mn

j n

u u u u u

u u u u u

u u u u u

i u u u u u

m u u u u u

L L

L L

L L

L L

M M M M O M O M

M M M M M M M M

L L

Juga

dor 1

Jugador 2

Page 14: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

El juego así definido consiste en que el jugador 1 escoge “filas” en tanto que el jugador 2 escoge “columnas” buscando hacer máximos sus pagos. Con Von Neumann y Morgenstern, los jugadores elegirán de acuerdo con una regla específica: El Jugador 1 escogerá la estrategia i que le maximiza el mínimo pago posible que le permite adquirir el jugador 2, es decir, resuelve el siguiente problema: max� min� ���

El Jugador 2 sabiendo que su oponente seleccionará la fila con el mayor pago, tratará de minimizar este resultado escogiendo aquella columna que hará mínimas sus pérdidas resolviendo el siguiente problema: min� max� ���

Encontrando de este modo una estrategia minimax que le genera un pago $� que es, a su turno, la ventaja que el jugador 2 obtiene por jugar el juego

Page 15: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Una posible solución consistente para el juego es aquella estrategia (i,j) que satisfaga la condición de maximización de ganancia igual a minimización de pérdidas, o sea: $� = max

�min

���� � min

�max

���� � $�

Este valor de equilibrio se denominó punto de silla o valor del juego:

-1

-0.5

0

0.5

1-1

-0.5

0

0.5

1

-1

-0.5

0

0.5

1

-1

-0.5

0

0.5

1

Page 16: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Elecciones (Monsalve & Arévalo, 2005): Dos candidatos se enfrentan en debate electoral en torno a la promesa de construir Para una de dos ciudades A, B un sistema de transporte masivo (STM). Cada uno de ellos debe anunciar, no sin costo político, su iniciativa al respecto, buscando el mayor número de votos posible. Podemos modelar esta situación como un juego en el que N = {1,2} son los jugadores (candidato 1 y candidato 2), S1 = S2 = {A, B, O} (Construir el STM en la ciudad A, construirlo en la ciudad B u omitir el tema), y la matriz de pagos es:

.45 .50 .40

.60 .55 .50

.45 .55 .40

A B O

A

B

O

Candidato 2C

an

did

ato

1

Page 17: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Si el candidato 1 dice construir el STM en la ciudad A y el candidato 2 promete construirlo para la ciudad B, cada uno obtendría un 50% de los votos. Para determinar el valor maximin de este juego suponga inicialmente dada la elección del candidato 1 y búsquese la estrategia del candidato 2 que minimiza el pago del candidato 1. Como consecuencia de esta política, el candidato 2, independientemente de la elección del candidato 1, deberá omitir el tema [que tiene los pagos más bajos para el candidato 1: (A,O)=.40 , (B,O)=.50 y (O,O)=.40 ]

Como el candidato 1 debe ahora maximizar su mínimo pago, deberá elegir Construir el STM a la ciudad B. El valor maxmin del juego, v1 = .50.

.45 .50 .40

.60 .55 .50

.45 .55 .40

A B O

A

B

O

Candidato 2C

an

did

ato

1

21max min iju

Page 18: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En el otro extremo, la definición del valor minimax del juego, empieza por encontrar los máximos valores de pago para el candidato 1: (B,A)=.60, (B,B)=.55, y (B,O)=.55:

El candidato 2 debe minimizar estos pagos por lo que su elección debería ser “Omitir el tema” que, a la luz de la elección del candidato 1 da (B,O)=.50. El valor minmax del juegos es, por tanto v2 = 0.5 = v1.

.45 .50 .40

.60 .55 .50

.45 .55 .40

A B O

A

B

O

Candidato 2

Ca

nd

idat

o 1

2 1min max iju

Page 19: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Un modo de saber si el juego tiene un saddle point consiste en computar los mínimos de cada fila y los máximos de cada columna para encontrar el número de la matriz que sea el menor de su fila y el máximo de su columna. Considere la siguiente matriz de juego (Fidalgo, 2005: 3):

Movistar Entphone Underhill Windtel Min

Movistar 10 -20 -5 -10 -20 Entphone 15 10 -5 -5 -5 Underhill 30 40 -10 -5 -10 Windtel 25 25 -30 -20 -30

PhoneCasie 10 -20 15 -5 -20 Max 30 40 15 -5

En -5 hay un punto de silla y corresponde a la elección (EntPhone,Windtel) y ninguno de los jugadores puede beneficiarse de un cambio unilateral. Fila pierde $5 como mal menor y columna gana $5 seguros

Page 20: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En contraste, la siguiente matriz de juego, no tiene punto de silla (en estrategias puras):

Movistar Entphone Underhill Windtel Min

Movistar 10 -20 -5 -1 -20 Entphone 15 10 -5 -10 -10 Underhill 30 40 -10 5 -10 Windtel 25 25 -30 -20 -30

PhoneCasie 10 -20 15 -5 -20 Max 30 40 15 5

Page 21: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo.— Encontrando Soluciones MiniMax con GAMS. La Siguiente pieza de código GAMS sugiere una forma de encontrar el valor de un juego usando las funciones smin() y smax() de ese lenguaje de computación técnica: set i Probabilidades /1*3/

j Probabilidades /1*3/;

alias(i,k);

alias(j,l);

table A0(i,j) Pagos

1 2 3

1 3 -1 -3

2 -3 3 1

3 -4 -3 3;

parameter minrow(i) Valor Mínimo Fila

maxcol(j) Valor Máximo Fila

minr Mínimo de los Valores Fila

maxc Máximo de los Valores Columna;

minrow(i) = smin(j, a0(i,j));

maxcol(j) = smax(i, a0(i,j));

minr = smin(i, minrow(i));

maxc = smax(j, maxcol(j));

display A0, minrow, maxcol, minr, maxc;

if( abs(minr-maxc)>0,

display 'No Saddle Point Solution

Exist';

else

if( minr=maxc,

display 'Existe una Solución MaxMin de estrategias puras en:', minr;

)

);

Page 22: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Matching Pennies (Monsalve & Arévalo, 2005): Dos jugadores tiran dos monedas al áire para ver sobre qué costado caen. Si caen con las dos caras o los dos sellos hacia arriba, el jugador 2 (jugador columna entregará su moneda al jugador 1 (jugador fila). Si las monedas caen, una mostrando la cara y la otra el sello ( o viceversa), será el jugador 1 quien deberá entregar su moneda al jugador 2. En este caso se tendrá: � = �1,2 , �� � �� � �%&'&, �())* Y la representación del Juego es:

Jugador 2

Cara Sello

Jugador 1 Cara 1, -1 -1, 1

Sello -1, 1 1,-1

Jugador 2

Cara Sello

Jugador 1 Cara 1 -1

Sello -1 1

Page 23: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Es decir, los pagos son: + ��� = 1 ��� � �1��� � �1 ��� � 1

, Los valores del juego para los jugadores 1,2 se computan como sigue:

$� � max�

min�

� max���� � �1, ��� � �1 � �1

$� � min�

max�

� min���� � 1, ��� � 1 � 1

Donde, como es claro $� - $� y no hay valor minimax del juego.

Jugador 2

Cara Sello

Jugador 1 Cara 1 -1

Sello -1 1

Page 24: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Piedra, Papel, Tijera (Monsalve & Arévalo, 2005): Dos niños juegan monedas de $1 a la piedra, papel, tijera. Las reglas de este conocido juego son como sigue (por si alguien no las recuerda): Papel Envuelve Piedra; Tijera Corta Papel; Piedra Rompe Tijera. La matriz de juego es:

Jugador 2

Piedra Papel Tijera

Jugador 2 Piedra 0 -1 1

Papel 1 0 -1

Tijera -1 1 0

Page 25: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

El jugador 1 deberá hallar aquella(s) estrategia(s) que maximiza(n) los pagos (mínimos) que con su elección estratégica, le permite el jugador 2: $� = max� min� ��� = max���� = −1, ��. = −1, �.� = −1 = −1

En tanto que en el caso del jugador 2, $� = min� max� ��� = min���� = 1, �.� = 1, ��� = 1 = 1

De nuevo, en este caso, $� ≠ $� y no hay valor minimax del juego.

Page 26: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

El Principio de Solución sugerido por Von Neumann y Morgenstern presenta entonces un difícil inconveniente por resolver porque el modelo no siempre tendrá una solución. Sobre esta situación, Monsalve y Arévalo (2005) comentan:

Lo sucedido en los ejemplos clásicos de “Tirar la Moneda” y “Piedra-Papel-Tijera” obligó a los autores del Theory of Games a tomar una decisión: o aceptaban el hecho de que los valores minimax no siempre existen (así que, en general, cierta indeterminación estaría presente en el análisis de múltiples situaciones de interacción entre agentes racionales) o se deshacían de la indeterminación mediante una modificación ingeniosa del proceso que conduce a la elección de la estrategia apropiada.2 (Monsalve & Arévalo, 2005: 21)

Dicha modificación consiste en dejar de lado la elección sobre estrategias puras, asignando a cada una de ellas un grado de certidumbre/incertidumbre descrito por una función de probabilidad específica. Solo por formalizar, tengamos en cuenta la siguiente definición:

2 Monsalve, S. y J. Arévalo (2005): Un Curso de teoría de Juegos Clásica. Bogotá: universidad Externado de Colombia.

Page 27: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Definición: Estrategia Mixta.— Una estrategia mixta para el jugador 1 es un vector de probabilidades / = �/�, ⋯ , /� , … , /1� donde /� ∀� = 1, … , � es la probabilidad de que el jugador 1 juegue la estrategia �, con /� ≥ 0 y ∑ /� = 11�5� . En forma paralela, una estrategia mixta para el jugador 2 es un vector 6 = 76�, … , 6� , … , 6�8 de probabilidades donde 6� es la probabilidad de que el jugador 2 juegue la j-ésima estrategia a su disposición, ∀� = 1, … , �, con 6� ≥ 0 y ∑ 6� = 1��5� .

Page 28: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

� En Hillas (1998), el concepto de estrategia mixta, puede estar asociado a la incertidumbre presente en la mente de los otros jugadores respecto de lo que el jugador bajo examen hará realmente.

� Pero quizás, de nuevo con Hillas, lo más importante es la idea de extender la función de utilidad de un jugador de aquella definida por el perfil de estrategias puras de un jugador a aquellas que se definen sobre las estrategias mixtas disponibles para un jugador. Si un representa la utilidad esperada del jugador n como función de un perfil de estrategias mixtas: � = ���, ��, … , ���

� Entonces ����� es el valor esperado de ����� cuando � es una variable

aleatoria con distribución �.

Page 29: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Para dos jugadores 1 y 2 supongamos que existen distribuciones de probabilidad / para el jugador 1, y 6 para el jugador 2. En particular tomemos: /9 = �/�, /�, … , /1�, : /�1

�5� = 1, /� ∈ <0,1= ∀� 69 = �6�, 6�, … , 6��, : 6��

�5� = 1, 6� ∈ <0,1= ∀� /� es la probabilidad de elegir la estrategia i por parte del jugador 1mientras que 6� es la probabilidad de elegir la estrategia j por parte del jugador 2. El valor esperado de una estrategia mixta es una combinación lineal de los pagos que para un jugador representan las estrategias disponibles por las probabilidades asociadas a cada una de ellas.

Page 30: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Así, por ejemplo, para los jugadores 1 y 2 tendremos, respectivamente: ?�/, �� = /���� + /����+, … + /1�1� ?�6, �� = 6���� + 6����+, … + 6���� Los jugadores deberán procurar elegir probabilidades adecuadas para resolver: maxA min� ?�/, ��

En el caso del jugador 1, y minB max� ?�6, ��

Entonces / y 6 son una solución del juego (punto de silla del juego). El valor esperado del juego, dadas las probabilidades / y 6 encontradas es, justamente, el valor minimax del juego.

Page 31: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Matching Pennies Otra Vez. — Consideremos de nuevo el juego de las dos monedas pero ahora tengamos en cuenta que los jugadores tienen distribuciones de probabilidad p y q con elementos correspondientes a cada una de las estrategias puras del juego:

Para el jugador 1 el valor esperado del juego se calcula como sigue: ?�/, %&'&� � /�1� @ �1 � /���1� � / � 1 @ / � 2/ @ 1

?�/, �())*� � /��1� @ �1 � /��1� � �/ @ 1 � / � �2/ @ 1 Gráficamente,

[q] [1-q]

Cara Sello

[p] Cara 1 -1

[1-q] Sello -1 1

J2J1

Page 32: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En el eje x aparece el conjunto de salida que es la distribución p; el conjunto de salida es el valor esperado del juego. La función min{ E(p, cara), E(p, sello) } es justamente la línea gruesa resaltada.

-1.0

-0.8

-0.6

-0.4

-0.2

-

0.2

0.4

0.6

0.8

1.0

0.0

00

0.1

25

0.2

50

0.3

75

0.5

00

0.6

25

0.7

50

0.8

75

1.0

00

E(p, cara)

E(p, sello)min{ E(p,cara), E(p, sello)}

Page 33: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En particular, para esta función tendremos: ?�/� = + 2/ − 1 �� / ≤ 1/2−2/ + 1 �� / ≥ 1/2, Recuerde que el jugador 1 deberá elegir apropiadamente valores de p que resuelvan: maxA min� ?�/, ��

Esto es, debe encontrar p que haga a E(p) lo más grande posible. El examen de la gráfica, y en especial, de la función de mínimo, permite deducir que este valor es cero (v1=0) y se obtiene cuando la probabilidad p es igual a ½.

Page 34: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En el caso del jugador 2, este deberá resolver el problema contrario: minimizar el máximo pago para el jugador 2 eligiendo la probabilidad q adecuada. En particular, los valores esperados del juego, cuando el jugador 1 juega “cara” o “sello” son: ?�6, %&'&� = 6�1� + �1 − 6��−1� = 6 − 1 + 6 = 26 − 1 ?�6, �())*� = 6�−1� + �1 − 6��+1� = −6 + 1 − 6 = −26 + 1 La solución para este jugador es la misma para el jugador 1: v2=0 cuando q = ½. Como conclusión el valor del juego v = v1 = v2 = 0, y se alcanza cuando p = q = ½.

Page 35: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Piedra, Papel y Tijera, Otra Vez.— Asignemos las distribuciones de probabilidad p y q a los jugadores 1 y 2, respectivamente de manera que la matriz de juego, incluyendo estas probabilidades queda:

Los valores esperados para el Jugador 1, dadas las distintas posibles elecciones del jugador 2 son: ?�/, E�(F'&� � �0�/� @ �1�/� @ ��1��1 � /� � /�� � /� @ 2/� � 1

?�/, E&/()� � ��1�/� @ �0�/� @ �1��1 � /� � /�� � �2/� � /� @ 1 ?�/, G��('&� � �1�/� @ ��1�/� @ �0��1 � /� � /�� � /� @ /�

Jugador 2 [q1] [q2] [1-q1-q2]

Piedra Papel Tijera

[p1] Piedra 0 -1 1

[p2] Papel 1 0 -1

[1-p1-p2] Tijera -1 1 0

Page 36: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Recuerde otra vez que el Jugador 1 deberá escoger probabilidades p que le permitan resolver: maxA min� ?�/, ��

En este caso, la función de mínimo es, precisamente, min�?�/, E�(F'&�, ?�/, E&/()�, ?�/, G��('&� O sea, ����</� + 2/� − 1=, <−2/� − /� + 1=, </� + /�= Es fácil comprobar que:

����</� + 2/� − 1=, <−2/� − /� + 1=, </� + /�= =HIJIK /� + 2/� − 1 ↔ 0 ≤ /�, /� ≤ �.−2/� − /� + 1 ↔ �. ≤ /�, �. − /� ≤ /� ≤ 1/� + /� ↔ /� ∈ M0, �.N , /� ∈ ��., 1= ,

Page 37: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Gráficamente,

-1

-0.5

0

0.5

1-1

-0.5

0

0.5

1

-4

-2

0

2

4

-1

-0.5

0

0.5

1

-1

-0.5

0

0.5

1

-1-0.5

00.5

1

-4

-2

0

2

4

-1

-0.5

0

0.5

1

-1-0.5

00.5

1

-1

-0.5

0

0.5

1

-1

-0.50

0.51

-4

-2

0

2

4

-1

-0.5

0

0.5

1

-1

-0.50

0.51

Page 38: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Los valores mínimos de los valores esperados del juego son negativos en las regiones especificadas y, consecuentemente, el máximo valor de esa función de mínimo es cero: ¿Cómo se resuelve el problema? La respuesta consiste en buscar donde se anula E(p) igualando las funciones encontradas, esto es, donde: </� + 2/� − 1= = <−2/� − /� + 1= = </� + /�= Tomando las dos primeras ecuaciones /� + 2/� − 1 = −2/� − /� + 1 ∴ /� = �. Note que ?�/� = /� + /� = 0 ↔ /� = /� → /� = PQ, por lo cual 1 − /� − /� = PQ El estudiante deberá comprobar que esto sucede igual para el jugador 2 y que, en efecto, v1 = v2 = 0, que es un valor que se alcanza cuando se juega piedra, papel o tijera con la misma probabilidad (1/3).

Page 39: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo (Monsalve & Arévalo, 2005): Dada la siguiente matriz de pagos, determine el valor del juego:

Para el Jugador 1, se tendrá: ?�/, &� � 3/ @ 2�1 � /� � / @ 2

?�/, S� � 4/ ?�/, U� � / @ 3�1 � /� � �2/ @ 3

Con la tabla y el gráfico a continuación, determinaremos el valor de:

min�</ @ 2=, <4/=, <�2/ @ 3=

Jugador 2 [q1] [q2]] [1-q1-q2]

Jugador 1 a b c

[p] A 3 4 1

[1-p] B 2 0 3

Page 40: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Para así determinar $� = max� min��?�/, &�, ?�/, S �, ?�/, U�

E (p,a ) E (p,b ) E (p,c )p+2 4p -2p + 3 min { . }

0.125 2.125 0.500 2.750 0.500 0.250 2.250 1.000 2.500 1.000 0.375 2.375 1.500 2.250 1.500 0.500 2.500 2.000 2.000 2.000 0.625 2.625 2.500 1.750 1.750 0.750 2.750 3.000 1.500 1.500 0.875 2.875 3.500 1.250 1.250 1.000 3.000 4.000 1.000 1.000

p

0.500

1.000

1.500

2.000

2.500

3.000

3.500

4.000

4.500

12.5% 25.0% 37.5% 50.0% 62.5% 75.0% 87.5% 100.0%

p

E(p)

p+2 4p -2p + 3 min { . }

Page 41: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Paramilitares y Guerrilleros (Monsalve & Arévalo, 2005): Actores de un conflicto armado, Paramilitares y Guerrilleros deben decidir acerca del número de comandos armados que deben enviar a dos frentes de batalla: X, Y. Las reglas son fáciles: el ejercito que más comandos envíe a un frente, vence allí. El ejército paramilitar tiene dos columnas armadas en tanto que el ejercito guerrillero cuenta con cuatro de esos comandos. Los pagos del ejército paramilitar dadas diferentes estrategias disponibles para cada ejercito en relación con el frente de batalla X:

Guerrilla Estrategia j

Paras 0 1 2 3 4

i 0 -1 -2 -1 0 0

1 0 -1 -2 -1 0

2 0 0 -1 -2 -1

Page 42: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Note que si los paramilitares envían una columna al frente X, y los guerrilleros no envían ninguna allí, los paras evidentemente se anotarán una victoria en ese frente; pero al mismo tiempo los guerrilleros enviarán todas sus columnas frente Y donde ganarán: el pago es cero porque se observa un empate. Además, como Monsalve y Arévalo hacen notar, al ejercito guerrillero le resultará igualmente redituable enviar 0 o 1 columnas al frente X; enviar un ejercito al frente X es al menos tan bueno como no enviar ninguno. Al mismo tiempo, enviar 4 columnas al frente Y es al menos tan bueno como enviar 3.

Guerrilla Estrategia j

Paras 0 1 2 3 4

i 0 -1 -2 -1 0 0

1 0 -1 -2 -1 0

2 0 0 -1 -2 -1

Page 43: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Si pi es la probabilidad de elegir la i-ésima estrategia por parte del jugador fila (paramilitares) y qj es la probabilidad de elegir la j-ésima estrategia por parte del jugador columna (guerrilleros) , la matriz de pagos (reducida) es:

Guerrilla j

q1 q2 1-q1-q2

Paras 1 2 3

i p1 0 -2 -1 0

p2 1 -1 -2 -1

1-p1-p2 2 0 -1 -2

Page 44: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Para el jugador fila, el valor del juego es aquel que: $� = maxA min� ?�/, ��

En este caso concreto: ?�/, 1� = −2/� − /�?�/, 2� = −1 − /�?�/, 3� = 2/� + /� − 2

En el caso del jugador 2: ?�0, 6� = −26� − 6�?�1, 6� = −1 − 6�?�2, 6� = 26� + 6� − 2

En el caso del jugador 1, al comparar las funciones de valor esperado se se encuentra fácilmente que, por ejemplo: −2/� − /� = −1 − /� → −2/� = −1 ∴ /� = ��, /� = 0, 1 − /� − /� = ��

Page 45: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Bajo estas consideraciones, el valor del juego es v1 = -1, según se corrobora observando el gráfico de la función,

min�<�2/� � /�=, <�1 � /�=, <2/� @ /� � 2= En donde resulta claro que el máximo valor de dicha función es justamente -1 cuando, según se ha encontrado, p1 = 0.5 y p2 = 0

0

0.25

0.5

0.75

1

p1

0

0.25

0.5

0.75

1

p2

-3

-2.5

-2

-1.5

-1

EHpL

0

0.25

0.5

0.75

1

p1

Page 46: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En el caso del ejercito guerrillero, el problema a resolver es: minB max� ?��, 6�

Para la cual, en este caso, ?�0, 6� = −26� − 6�?�1, 6� = −1 − 6�?�2, 6� = 26� + 6� − 2

Y de donde q1 = 0.5, q2 = 0, 1 – q1- q2 = 0.5. Para estos valores, v2 = -1 de manera que: −1 = $� = maxA min� ?�/, �� = minB max� ?��, 6� = $� = −1

La solución (valor) de este juego de guerra dice sencillamente que el valor esperado del conflicto es perder. En particular el ejercito paramilitar debe lanzar una moneda para decidir si va con todas sus columnas al frente X o al frente Y, en tanto que el ejercito guerrillero debe lanzar una moneda para decidir a cual de los dos frentes envía tres de sus comandos, enviando el cuarto al otro.

Page 47: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

El Teorema MinMax Formalicemos los hallazgos obtenidos a través de los ejemplos provistos: En un juego de suma cero, en el que los intereses de los jugadores son opuestos y hay � = �1,2 jugadores, el primero con m estrategias y el segundo con n, la representación del juego admite una representación matricial:

V = W X�� ⋯ X��⋮ ⋱ ⋮X1� ⋯ X1�[

Donde X�� es el pago recibido por el jugador 1 cuando juega la estrategia i y el jugador 2 juega la estrategia j.

Page 48: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Para las distribuciones de probabilidad /9 = �/�, … , /� , … /1� y 69 = 76�, … , 6� , … 6�8 el pago esperado por el jugador 1 (fila) al decidirse por la estrategia i, cuando su oponente (jugador columna) decide jugar la estrategia j es: X��/�6�. El pago total esperado es, ex ante: : : X��/�6�1

�5���5�

En términos matriciales, 6V/9

Page 49: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Considere la siguiente representación del juego de Matching Pennies: V = M−1 1

1 �1N Entonces 6V/9 = �6, 1 � 6� M�1 1

1 �1N \ /1 � /]

6V/9 � �1, 1 � 6��2/ � 1, 1 � 2/� � �2 @ 46�/ � 26 @ 1

0

0.25

0.5

0.75

1

p

0

0.25

0.5

0.75

1

q

-1

-0.5

0

0.5

1

EHp,qL0

0.25

0.5

0.75

1

p

Page 50: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En estas circunstancias, el Jugador 1 tendrá una ganancia de por lo menos: $� ≥ maxA minB 6V/9

En tanto que el Jugador II tendrá una perdida de cuando más $� ≤ minA maxB 6V/9

Si se quiere asegurar que la cantidad que el Jugador 1 busca ganar coincida con la que el Jugador 2 está dispuesto a perder (y viceversa), deberían encontrarse /∗ y 6∗ tales que: maxA minB 6V/9 = minA maxB 6V/9

La existencia de los vectores /∗ y 6∗ constituye el contenido del teorema MinMax que se presenta a continuación:

Page 51: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Teorema MinMax (Von Neumann, 1928): Sea V una matriz cualquiera de orden � × �. Para esta matriz existen distribuciones de probabilidad /∗ ∈ ℝ_� y 6∗ ∈ ℝ_1 tales que: maxA minB 6∗V/∗9 = minB maxA 6∗V/∗9

Es decir, el valor minmax sobre todas las estrategias mixtas iguala al valor maxmin. En adición, si el máximo en el lado izquierdo se alcanza en /∗ y el mínimo en el lado derecho se alcanza en 6∗, entonces ningún jugador estará dispuesto a cambiar su estrategia en forma unilateral, o sea: 6∗V/9 ≤ 6∗V/∗9 ≤ 6V/∗9

Page 52: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Se lanza al aire una moneda y muestra el resultado al jugador H que puede pasar o apostar. Si pasa le paga $1 al jugador K. si sigue, el jugador K puede pasar o apostar. Si pasa y había salido Cara debe pagar $2 al jugador H, pero si había salid sello, es H el que debe pagar $2 a K. Si los dos jugadores siguen jugando K debe pagar $1 a H. El perfil de estrategias de H es: {P, A, PA, AP} donde: � P: Pasar Siempre, � A: Apostar Siempre, � PA: Pasar si sale cara y apostar si sale sello, � AP: Apostar si sale Cara y pasar si sale sello

El perfil de estrategias para K contiene solamente P (pasar) o A (Apostar).

Page 53: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Por lo tanto hay cuatro (4) consecuencias posibles para la ganancia de H: i. Ganancia de $1 si los dos deciden apostar, ii. Ganancia de -$1 si H pasa, iii. Ganancia de $2 si H apuesta, K apuesta y sale cara; y iv. Ganancia de -$2 si H apuesta, K pasa y sale sello.

Si la probabilidad de sacar cara es ½, la matriz de juego es:

Jugador H Jugador K

Mínimos P A

P -1 -1 -1

PA �−1��� + �−2��� = −.� �−1��� + �1��� = 0 −.�

AP 2�� + �−1��� = �� 1�� + �−1��� = 0 0

A 2�� + �−2��� = 0 1 0

Máximos �� 1

El juego no tiene punto de silla. Sin embargo, note que las estrategias P y PA del jugador H producen la peores ganancias para el jugador H, sin importar qué juegue K y se dicen

Page 54: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

dominadas por las estrategias PA, y A. El jugador H no las va a jugar. Si se eliminan estas estrategias, tendremos la siguiente matriz de juego

Jugador H Jugador K

Mínimos P A

AP 2�� + �−1��� = �� 1�� + �−1��� = 0 0

A 2�� + �−2��� = 0 1 0

Máximos �� 1

Al tener solo dos estrategias por jugador es posible obtener una solución gráfica. Suponiendo las estrategias mixtas �/, 1 − /� para el jugador H y �6, 1 − 6� para el jugador K, se tendrá:

Page 55: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

� Si K decide pasar: P̀/ + �1 � /��0� � P`/

� Si K decide apostar: �0�/ @ �1��1 � /� � 1 � /

� Si H decide PA: P`6 @ �0��1 � 6� � �

� 6

� Si H se decide por A: �0�6 @ �1��1 � 6� � 1 � 6

Jugador H Jugador K

Page 56: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Juegos de Suma Constante con dos Jugadores Aquí la suma de los pagos de los dos jugadores es constante como el caso de una cantidad fija que hay que repartir entre los dos individuos (ejemplo de la votación): Los juegos de suma cero son un caso especial. Ejemplo (López Fidalgo, 2007: 3) dos empresas de catering ofrecen servicios en un evento de 3000 personas. Deben ofrecer menú y publicidad. La firma 1 ofrece tres modalidades distintas, en tanto que la firma 2, ofrece dos combinaciones distintas. La matriz de pagos es:

Firma 1 Firma 2

Modalidad 1 Modalidad 2 Mínimos Modalidad 1 1500 2400 1500 Modalidad 2 1400 2600 1400 Modalidad 3 1500 1400 1400

Maximos 1500 2600

Page 57: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Algunos Métodos de Solución Solución General

1. Verificar la Existencia de Saddle Points; 2. De no haber solución de saddle point inmediata, elimine las estrategias

dominadas por jugador fila y por jugador columna hasta que no haya estrategias dominadas (eliminación iterada de estrategias dominadas).

3. Si la matriz de juego es 2x2 resuelva gráficamente. En caso contrario formule y resuelva un programa lineal que represente el juego

Page 58: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Solución vía Programación Lineal Considere el caso del Jugador Fila.

max a = $ �. &.HIJIK$ ≤ &��/�+, … + &1�/1⋮$ ≤ &��/�+, … + &1�/11 = : /�1

�5�0 ≤ /� , � = 1, … , �,

En tanto que para el jugador columna, el programa es:

max a = c �. &.HIJIKc ≤ &��6�+, … + &��6�⋮c ≤ &��/�+, … + &1��1 = : 6��

�5�0 ≤ 6�, � = 1, … , �,

Page 59: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo.— Considere dos firmas que compiten en una licitación pública. Cada una de ellas ofrece tres tipos distintos de configuraciones de proyecto, �/� /� /. . La matriz A de pagos es la que sigue. (1 significa vencer, -1 perder la licitación y 0, declaración de desierto para la licitación):

Firma F Firma C

Mínimos Proyecto 1 Proyecto 2 Proyecto 3

Proyecto 1 0 -1 1 -1 Proyecto 2 1 0 -1 -1 Proyecto 3 -1 1 0 -1 Máximos 1 1 1

De la comparación de mínimos fila y máximos columna se observa que max�5�,…,1 + min�5�,…,� &��d ≠ min�5�,..,� e max�5�,…,1 &��f

Page 60: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Formulando el problema como un programa lineal, para el jugador Fila (Firma F) el problema es3:

max a = $ �. &. : HIJIK $ ≤ /� − /.$ ≤ −/� + /.$ ≤ /� − /�1 = /� + /� + /.0 ≤ /�, /�, /.

, Igualando las dos primeras ecuaciones: /� − /. = −/� + /. → /. = /� + /�2

Utilizando la Restricción 1 = /� + /� + /., /� + /� + /� + /�2 = 1 → /� + /� = 32

/. = /� + /�2 = 3 2⁄2 ∴ /. = 13

Ahora, considerando /� − /� = −/� + /. → /. + 3/� = h. ∴ /� = �.

Luego /∗ = \13 13 13]9 ∎

3 La solución en el caso del jugador II se obtiene mediante procedimientos análogos y se deja como ejercicio.

Page 61: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

El Principio de Indiferencia (Ferguson, 2011: 17) Sea V1×� una matriz de juego. Si el jugador I usa una estrategia mixta /9 = �/�, … , /1�9 y el jugador II opera sobre la j-ésima columna, entonces el pago promedio del Jugador I es ∑ /�&��1�5� Si $ es el valor del juego, entonces una estrategia óptima / está caracterizada por el hecho de que el pagor promedio del Jugador I es por lo menos igual a j sin importar lo que juegue el Jugador II: : /�&��1

�5� ≥ $ ∀�

En forma similar, para el Jugador II se esperaría que : &��6��

�5� ≤ $ ∀�

Page 62: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Cuando los jugadores I y II usan estrategias óptimas el pago promedio es exactamente igual al valor del juego, i.e., : : /�&��6� = $��

En efecto, usando la inecuación de Von Neumann-Morgenstern: $ = : $6��

�5� ≤ : k: /�&��1�5� l =�

�5� : : /�&��6��� = : /� m: &��6���5� n1

�5�≤ : /�$1�5� = $

Page 63: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Teorema del Equilibrio (Ferguson, 2007: II-17) Considere un juego caracterizado por una matriz V de orden � × � y valor del juego $ . Sea / = �/�, … , /� , … , /1�9 una determinada estrategia óptima para el

Jugador I (digamos, el jugador fila), y 6 = 76�, … , 6� , … , 6�89 una estrategia óptima

para el Jugador II (el jugador columna). Entonces: : &��6��

�5� = j ∀/� > 0

y : /�&��1

�5� = j ∀6� = 0

Page 64: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Demostración.— Suponga que no es cierto y que existe un /p > 0 y que ∑ &p�6���5� ≠ j . Entonces, dado : &��6��

�5� ≤ j ∀� Necesariamente : &p�6��

�5� < j ∀� Pero por la inecuación de Von Neumann-Morgenstern j = : /� m: &��6��

�5� n1�5� < : /�j1

�5� = j

Que implica una desigualdad estricta puesto que es estricta para el k-ésimo término en la suma∎

Page 65: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Intuitivamente, el significado del teorema propuesto es que si existe una estrategia óptima para el Jugador I que otorga probabilidades estrictamente positivas a la i-ésima fila, entonces toda estrategia óptima del Jugador II proporciona al jugador I el valor del juego, si este usa la fila i. El teorema sugiere, —para el caso del Jugador I—, tratar de encontrar una solución para el sistema de ecuaciones : /�&��1

�5� = j ∀6� = 0

Conformada por todas aquellas j para las cuales se cree que existen /� > 0. “Una forma de decir lo mismo es que el Jugador I busca una estrategia que hace indiferente al Jugador II respecto de cuales estrategias (de valor positivo) usar. En forma similar, el Jugador II debería jugar de manera tal que al Jugador I le resulte indiferente cualquiera de las estrategias puras a su disposición. Esto es lo que se llama Principio de Indiferencia” (Ferguson: 2007: 18)

Page 66: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Considere el siguiente juego (Pares y Nones):

r 0 1 −21 −2 3−2 3 4 s

En este caso resulta difícil saber quien tiene la ventaja. Si se juega el juego en forma repetida, parecería ser el caso de que el jugador columna dará probabilidades positivas a todas las columnas. Si este supuesto es adecuado, entonces el Jugador I debería jugar a hacer al Jugador II indiferente y por tanto la estrategia óptima del Jugador I debería satisfacer: /� − 2/. = j <1=/� − 2/� + 3/. = j <2=−2/� + 2/� + 4/. = j <3=

Para algún $, habida cuenta que se espera que /� + /� + /. = 1 <4=

Page 67: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

A partir de [1] y [2]: /� − 2/. = /� − 2/� + 3/. ∴ /� − 3/� + 5/. = 0 <5= Considerando en Forma Conjunta a [2] y [3]: /� − 2/� + 3/. = −2/� + 2/� + 4/. ∴ 3/� − 5/� + 7/. = 0 <6= Junto con la identidad [4] se tiene el siguiente sistema de ecuaciones de la forma Vw = S

r1 −3 53 −5 71 1 1s r/�/�/.s = r001s <7=

Page 68: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

De donde, como es usual, una solución del tipo w = Vx�S es, en este caso:

r/�/�/.s = r1 −3 53 −5 71 1 1s r001s = Py r−3 2 11 −1 22 −1 1s r001s

Esto es, �/� /� /.�9 = \�h �h �h]9 ∎

En consecuencia, el valor del juego es por lo menos $ = 0 si el supuesto de acuerdo con el cual la estrategia óptima del Jugador II otorga ponderaciones positivas a todas las columnas es correcto.

Page 69: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Un programa GAMS (General Algebraic Modeling System) para resolver el sistema [1]~[4] es el que aparece a continuación (fragmento): variables

p1 Probabilidad asociada a la Estrategia fila 1

p2 Probabilidad asociada a la Estrategia fila 2

p3 Probabilidad asociada a la Estrategia fila 3

V Valor del Juego;

equations

eq1 Valor del Juego para I si II juega la estrategia 1

eq2 Valor del Juego para I si II juega la estrategia 2

eq3 Valor del Juego para I si II juega la estrategia 3

eq4 Identidad Probabilistica;

eq1.. p2 - 2*p3 =e= V;

eq2.. p1 - 2*p2 + 3*p3 =e= V;

eq3.. -2*p1 +3*p2 - 4*p3 =e= V;

eq4.. p1 + p2 + p3 =e= 1;

model oddeven /all/;

Page 70: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Los resultados del programa se muestran a continuación (SolEQU, SolVAR): LOWER LEVEL UPPER

---- EQU eq1 . . . ---- EQU eq2 . . .

---- EQU eq3 . . .

---- EQU eq4 1.000 1.000 1.000

eq1 Valor del Juego para I si II juega la estrategia 1 eq2 Valor del Juego para I si II juega la estrategia 2

eq3 Valor del Juego para I si II juega la estrategia 3

eq4 Identidad Probabilistica

LOWER LEVEL UPPER

---- VAR p1 . 0.250 +INF

---- VAR p2 . 0.500 +INF ---- VAR p3 . 0.250 +INF

---- VAR V -INF -1.11E-16 +INF

p1 Probabilidad asociada a la Estrategia fila 1

p2 Probabilidad asociada a la Estrategia fila 2

p3 Probabilidad asociada a la Estrategia fila 3

V Valor del Juego

Page 71: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: (López Fidalgo, 2008: 11). Considere de nuevo el juego de las licitaciones ya presentado. La matriz de juego es:

Firma F Firma C

Mínimos Proyecto 1 Proyecto 2 Proyecto 3

Proyecto 1 0 -1 1 -1 Proyecto 2 1 0 -1 -1 Proyecto 3 -1 1 0 -1 Máximos 1 1 1

Y supondremos con el principio de indiferencia que el Jugador I (La firma F) resuelve el problema:

max a = $ �. &.: HIJIK $ ≤ /� − /.$ ≤ −/� + /.$ ≤ /� − /�1 = /� + /� + /.0 ≤ /�, /�, /.

,

Page 72: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Si suponemos que el Jugador Fila adoptará una estrategia mixta que mantenga al jugador II indiferente w.r.t. sus estrategias puras, el problema puede transformarse en el de encontrar la solución del CNS: /� + /� − 2/. = 0−2/� + /� + /. = 0/� + /� + /. = 1

En formato matricial,

r 1 1 −2−2 1 11 1 1 s r/�/�/.s = r001s

De modo que r/�/�/.s = r 1 1 −2−2 1 11 1 1 sx� r001s = �. r 0 −1 11 1 1−1 0 1s r001s = r1/31/31/3s

Page 73: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Juegos No Singulares: Considere un juego con matriz de pagos � × � cuadrada V y suponga que esta matriz tiene inversa. Asuma que I tiene una estrategia óptima con ponderadores positivos para todas y cada una de las filas (es decir, se asume que todas las estrategias están activas). Entonces, por el principio de indiferencia, cada una de las estrategias óptimas 6 del Jugador II deberá satisfacer: : &��6� = $1

�5�

Que es un sistema de � ecuaciones en � variables. Si V es no singular, el sistema se podrá resolver para 6�. En términos matriciales, si 6 es el vector de estrategias del individuo II, y 1 = �1,1, … ,1�9 representa un vector columna de unos, el sistema es: V6 = $1 Note que $ no puede ser cero pues en otro caso V sería singular. Como se supone lo contrario, existe Vx�

Page 74: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Multiplicando por Vx� los dos lados de

W &�� ⋯ &�1⋮ ⋱ ⋮&1� ⋯ &11[�1×1� W 6�⋮61[�1×�� = $ W111[�1×�� Se tendrá:

W &�� ⋯ &�1⋮ ⋱ ⋮&1� ⋯ &11[�1×1� W &�� ⋯ &�1⋮ ⋱ ⋮&1� ⋯ &11[�1×1�x� W 6�⋮61[�1×�� = $ W &�� ⋯ &�1⋮ ⋱ ⋮&1� ⋯ &11[�1×1�

x� W111[�1×�� Es decir: 6 = $Vx�1 Si el valor del juego $ fuera conocido, se tendría la estrategia óptima única para el Jugador II. Para encontrar $ se puede partir del hecho de que ∑ 6� = 11�5� . En notación vectorial:

�1, … ,1�9 r 6�⋮61s = 196 = 1

Page 75: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Entonces, multiplicando a ambos lados de 6 = $Vx�1 por 19, se tendría, en consecuencia: 1 = 196 = $19Vx�1 $19Vx�1 = 1 Y por lo tanto, el valor estimado del juego es: $ = 119Vx�1

Reuniendo todo a partir de 6 = $Vx�1: 6∗ = Vx�119Vx�1

� Observación: Si algún componente 6� es negativo, el supuesto de acuerdo con el cual el

Jugador I tiene una estrategia con pesos todos positivos debe revisarse (y el problema resolverse utilizando, por ejemplo, el método simplex)

Page 76: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

En cualquier caso, si se encuentra que 6� ≥ 0 ∀� = 1, … , � la estrategia óptima para el Jugador I se puede encontrar aplicando el mismo conjunto de hipótesis. En particular, /∗9 = 19Vx�19Vx�1

Si, finalmente, /� ≥ 0 ∀� = 1, … , � entonces, / y 6 son estrategias óptimas pues ambas garantizan un pago promedio igual a $ sin importar lo que el otro jugador haga.

Page 77: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Teorema.— Estrategias Óptimas en Juegos No Singulares Suponga que la matriz de juego V es no singular y que 19Vx�1 ≠ 0. Entonces, el valor del juego con matriz de pagos V es: $ = 119Vx�1

Mientras que las estrategias óptimas para los jugadores involucrados son: /9 = $19Vx� 6 = $Vx�1 Siempre que / ≥ 0 y 6 ≥ 0

Page 78: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Suponga que un juego presenta la siguiente matriz:

V = r 1 2 −12 −1 4−1 4 −3s

En este caso,

Vx� = r 0,8125 −0,1250 −0,4375−0,1250 0,2500 0,3750−0,4375 0,3750 0,3125 s

Note que

19Vx�1 = �1 1 1� r 0,8125 −0,1250 −0,4375−0,1250 0,2500 0,3750−0,4375 0,3750 0,3125 s r111s = 1

De modo que $ = �19Vx�1�x� = 1 1⁄ = 1

Page 79: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Además,

/9 = 19Vx� = �1 1 1��×. r 0,8125 −0,1250 −0,4375−0,1250 0,2500 0,3750−0,4375 0,3750 0,3125 s.×.

/9 = �0.25 0.50 0.25��×.

6 = Vx�1 = r 0,8125 −0,1250 −0,4375−0,1250 0,2500 0,3750−0,4375 0,3750 0,3125 s.×. r111s.×�

6 = r0.250.500.25s

/, 6 ≥ 0 luego son óptimas y el valor del juego es $ = 1

Page 80: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Suponga que un juego presenta la siguiente matriz:

V = r 3 −1 −3−3 3 1−4 −3 3 s

La matriz inversa de A es:

Vx� = r−0.3750 −0.3750 −0.2500−0.1563 0.0938 −0.1875−0.6563 −0.4063 −0.1875s

La inversa de la suma de los elementos de Vx� da $ = 1/�19Vx�1�x� = �x�.| = −0.4. De aquí, las estrategias óptimas para los Jugadores I y II son, /9∗ = �0.475, 0.275, 0.250�9 69∗ = �0.400, 0.100, 0.500�9

Page 81: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Alternativamente, es posible representar este juego como un problema de optimización típico de la forma:

max a = c �. &.HIJIKc ≤ &��6�+, … + &��6�⋮c ≤ &��/�+, … + &1��1 = : 6��

�5�0 ≤ 6� , � = 1, … , �,

Para resolver numéricamente el mismo ejemplo, considere el listado GAMS a continuación.

Page 82: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

*---

*--- Solución de Via Programación Matemática de un Juego Singular

*---

set i Estrategias Puras – Jugador Fila /1*3/

j Estrategias Puras – Jugador Columna /1*3/;

alias(i,k); alias(j,l);

table A0(i,j) Matriz de Pagos

1 2 3 1 3 -1 -3

2 -3 3 1

3 -4 -3 3;

*--- Se investiga si el Juego tiene un saddle point en estrategias puras

parameter minrow(i) Valor Mínimo Fila

maxcol(j) Valor Máximo Fila

minr Mínimo de los Valores Fila

maxc Máximo de los Valores Columna;

minrow(i) = smin(j, a0(i,j));

maxcol(j) = smax(i, a0(i,j));

minr = smin(i, minrow(i));

maxc = smax(j, maxcol(j));

Page 83: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

display A0, minrow, maxcol, minr, maxc;

if( abs(minr-maxc)>0,

display 'No Saddle Point Solution Exist';

else if( minr=maxc,

display 'Existe una Solución MaxMin de estrategias puras en:', minr; )

);

parameter

A(i,j) Matriz de Pagos Modificada;

A(i,j) = A0(i,j) + 5;

variables

p(j) Probabilidades

w Objetivos ;

equations

obj Función Objetivo

restr(i) Definición del Valor del Juego

equil Condición de Equilibrio en Probabilidades;

obj.. w =e= sum(j, p(j));

restr(i).. sum(j, a(i,j)*p(j)) =e= 1;

Page 84: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

equil.. sum(j, p(j)) =e= 1;

model paso

/

obj restr

* equil

/ ;

p.lo(j) = 0; p.l(j) = 0.0001;

solve paso using lp maximizing W;

*--- Transformando el Problema para eliminar el slack

parameter report reporte de resultados;

report("Valor del Juego", "Valor") = (1/W.l) - 5;

report("Probabilidad",j) = p.l(j)/w.l;

report("Probabilidad","Valor") = sum(j,p.l(j)/w.l);

display report;

Page 85: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

S O L V E S U M M A R Y

MODEL paso OBJECTIVE w TYPE LP DIRECTION MAXIMIZE

SOLVER CPLEX FROM LINE 70

**** SOLVER STATUS 1 Normal Completion

**** MODEL STATUS 1 Optimal **** OBJECTIVE VALUE 0.2174

LP status(1): optimal Cplex Time: 0.02sec (det. 0.01 ticks)

LOWER LEVEL UPPER MARGINAL

---- EQU obj . . . 1.000

obj Función Objetivo

---- EQU restr Definición del Valor del Juego

LOWER LEVEL UPPER MARGINAL

1 1.000 1.000 1.000 0.103

2 1.000 1.000 1.000 0.060

3 1.000 1.000 1.000 0.054

Page 86: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

---- VAR p Probabilidades

LOWER LEVEL UPPER MARGINAL

1 . 0.087 +INF .

2 . 0.022 +INF . 3 . 0.109 +INF .

LOWER LEVEL UPPER MARGINAL

---- VAR w -INF 0.217 +INF .

**** REPORT SUMMARY : 0 NONOPT 0 INFEASIBLE

0 UNBOUNDED

---- 80 PARAMETER report reporte de resultados

1 2 3 Valor

Valor del Juego -0.400

Probabilidad 0.400 0.100 0.500 1.000

Page 87: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Juegos Diagonales.— Suponga que un juego determinado tiene una matriz de pagos

V = }F� 0 ⋯ 00 F� ⋯ 0⋮ ⋮ ⋱ ⋮0 0 ⋯ F1~

Donde F� > 0, ∀� = 1, … , �. Por el principio de indiferencia, /�F� = j ∴ /� = j/F� ∀� Sumando sobre � 1 = j : 1/F�1

�5�

Es decir, el valor del juego es: j = k: 1/F�1�5� lx�

Page 88: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Ejemplo: Considere un juego diagonal con matriz de pagos:

V = }1 0 0 00 2 0 00 0 3 00 0 0 4~

Aquí ∑ 1/F�1�5� = PP_P̀_PQ_Py5`�P`

Por tanto, $ = ���| Y las estrategias óptimas son: / = 6 = \���|, ��|, h�|, .�|] ∎

Page 89: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

Referencias

[1.] Bierman, H.S. and L. Fernandez (1998): Game Theory with Economic Applications. Reading (MA): Addison-Wesley.

[2.] Ferguson, T.S. (2006): Game Theory. Lecture Notes. Department of Mathematics. University of California.

[3.] Fundenberg, D. and J. Tirole (1992): Game Theory. Cambridge: MIT press. [4.] Gibbons, R. (1992): Un Primer Curso de Teoría de Juegos. Barcelona: Antoni Bosch. [5.] Hillas, J., D. Kvasov and A. Schiff (2012):Game Theory and Economic Applications.

Auckland (NZ): The University of Auckland. [6.] Jehle, G. and P.J. Reny (2001): Advanced Microeconomic Theory. N.Y.: Addison-Wesley. [7.] López Fidalgo, J. (2008): Teoría de Juegos. Universidad de Castilla-La Mancha.

Lecture Notes [8.] Manrique, O., E. Villa, G. Junca y S. Monsalve (1999): Competencia Imperfecta I:

Equilibrio de Nash en Juegos Estaticos. Capítulo IV En: Monsalve, S. [ed.] (1999): Introducción a los Conceptos de Equilibrio en Economía. Bogotá: Universidad Nacional de Colombia.

[9.] Monsalve, S. [ed.] (1999): Introducción a los Conceptos de Equilibrio en Economía. Bogotá: Universidad Nacional de Colombia.

Page 90: Segura   2013 -- juegos de suma cero - v1

Teoría de los Juegos // @JackFlash

[10.] Monsalve, S. y J. Arévalo [eds.] (2005): Un Curso de Teoría de Juegos Clásica. Bogotá: Universidad Externado de Colombia.

[11.] Varian, H. (1993): Microeconomic Analysis. N.Y.: Norton & Co.