yjuegos bipersonales de suma nula yjuegos semi-infinitos · 2015-07-22 · • juegos n-personales...

25
Juegos bipersonales de suma nula Juegos semi-infinitos Mª Enriqueta Vercher González Universitat de València

Upload: others

Post on 23-Mar-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

Juegos bipersonales de suma nulaJuegos semi-infinitos

Mª Enriqueta Vercher GonzálezUniversitat de València

Page 2: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

2

ÍndiceIntroducción

Juego bipersonal de suma nulaPares de equilibrio

Estrategias mixtas

Teorema del Minimax

Determinación de estrategias óptimas

Juegos semi-infinitos

Referencias

Homenaje a Marco A. López Cerdá. Alacant 2010 2

Page 3: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

3

Teoría de JuegosLa Teoría de Juegos es una colección de modelos matemáticos formulados para estudiar la toma de decisiones en ambiente de conflicto y/o cooperación.Un juego consta de n jugadores que deben elegir de una lista de alternativas sobre las que tienen diferentes preferencias (Von Neumann and Morgenstern, 1944)Un juego puede describirse mediante un árbol de decisión (forma extensiva) o mediante la descripción de todas las estrategias puras de cada jugador y los pagos asociados a cada estrategia pura (forma normal).

Homenaje a Marco A. López Cerdá. Alacant 2010 3

Page 4: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

4Homenaje a Marco A. López Cerdá. Alacant 2010

Ejemplos• Juegos n-personales

• Juegos bipersonales• finitos

• rectangulares de suma nula• cooperativos: dilema del prisionero• multi-etápicos

• Juegos de supervivencia• Juegos estocásticos

• infinitos• Juegos sobre el cuadrado unidad

• semi-infinitos

Page 5: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

5

Forma normal de un juegoUna estrategia pura πi∈Εi para un jugador Ji, i=1,…,n es un programa completo de acción, que en cualquier instante del juego dicta la elección a tomar.La función de pago a cada jugador explicita el pago que recibe cada jugador para cada conjunto de estrategias puras:Ρi: E1×E2 × … × En→ℜ i=1,…, nUn conjunto de estrategias π′ está en equilibrio si y solo si ∀πj∈Εj se tiene que Pj(πj, π′(n -1))≤Ρj(π′), j=1…n

Un jugador racional no deseará separarse de este conjunto

Homenaje a Marco A. López Cerdá. Alacant 2010 5

)(),()(),( 221222121111 ππππππππ PPEyPPE ≤∈∀≤∈∀

Page 6: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

6

Juego bipersonal de suma nulaUn juego bipersonal es de suma nula si y solo si para todo

Un juego bipersonal de suma nula (rectangular) queda definido por los dos conjuntos de estrategias puras y la función de pago al jugador J1, respectivamente:

La función de pago puede representarse mediante una matriz (m×n), siendo J1 (I) el jugador fila y J2 (II) el jugador columna.

Homenaje a Marco A. López Cerdá. Alacant 2010 6

0)()( 2121 =+×∈ πππ PPEE

{ } { } ijjinm aPyEE === ),(,,,,, 1211 βαββαα LL

Page 7: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

7

Juego bipersonal de suma nula

Los pares de equilibrio (αi0, βj0) verifican que:

Siendo el elemento el máximo de la columna (j0) y el mínimo de la fila (i0), es decir es un punto de silla de la función de pago del jugador I:

Los pares de equilibrio son equivalentes e intercambiables, y conducen al pago de equilibrio

que se conoce como valor del juego.

Homenaje a Marco A. López Cerdá. Alacant 2010 7

000000,...,1,...,1 jijijiij aanjyaami −≤−=∀≤=∀

00 jia

njPaaPami jijijijiij ,...,1),(),(,...,1000000

=∀=≤≤==∀ βαβα

00 jia

Page 8: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

8

Juegos sin puntos de silla

{ } { }212211 ,,, ββαα == EE

Homenaje a Marco A. López Cerdá. Alacant 2010 8

⎥⎦

⎤⎢⎣

⎡3124

{ } { } 33,4minmaxmin ,..,1,..,1' === == ijminjII av

{ } { } 21,2maxminmax ,..,1,..,1' === == ijnjmiI av

Para juegos sin puntos de silla no se puede decidir que estrategia dará mejor resultado al jugador. No se da una situación de equilibrio y el juego no tiene valor.Ejemplo: Consideremos un juego donde con matriz de pagos

El beneficio máximo que puede asegurarse I

El tope a la ganancia de I que puede imponer II

Page 9: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

9

Estrategias mixtasUna estrategia mixta es una distribución de probabilidad sobre el conjunto de estrategias puras. Respectivamente:

El pago esperado si se eligen las estrategias x e y es

El valor maximin vI y la estrategia maximin x∈X son, resp.

El valor minimax vII y la estrategia minimax y∈Y son, resp.

Homenaje a Marco A. López Cerdá. Alacant 2010 9

⎭⎬⎫

⎩⎨⎧

=≥ℜ∈=⎭⎬⎫

⎩⎨⎧

=≥ℜ∈= ∑∑==

n

jjj

nm

iii

m yyyYexxxX11

1,0:1,0:

∑∑= =

==m

i

n

j

Tjiji AyxyaxyxP

1 1),(

IjnjXxXxI vxvyxPxvv === =∈∈ )()},({minmax)(max ,..,1 β

IIimiYyYyII vyvyyPyvv === =∈∈ )()},({maxmin)(min ,..,1 α

Page 10: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

10

El valor maximin vI es la ganancia esperada que puede asegurarse el jugador I si elige una estrategia maximinx∈X, tal que v(x)=vI.

El valor minimax vII es el tope a la ganancia esperada del jugador I si elige una estrategia minimax y∈Y, tal que v(y)=vII. En particular, v(y0) es la pérdida máxima del jugador II si elige una estrategia y0∈Y.

Se tiene, además, que:

Homenaje a Marco A. López Cerdá. Alacant 2010 10

''IIIIII vvvv ≤≤≤

Estrategias mixtas

Page 11: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

11

Teorema del MinimaxUn resultado fundamental en la Teoría de Juegos es el Teorema del Minimax vI = vII mediante el cual se establece la optimalidad de las estrategias maximin y minimax para ambos jugadores.

La primera demostración de este teorema se debe a VonNeumann (1928), que utilizó un teorema de separación estricta y un teorema de alternativa (véase Owen, 1968).

En el libro de Parthasarathy and Raghavan (1971) puede encontrarse una colección exhaustiva de teoremas generales del minimax.

Homenaje a Marco A. López Cerdá. Alacant 2010 11

Page 12: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

12

Teorema General del MinimaxSean dos conjuntos compactos convexos no vacíos y sea

Sea fx(.) una función convexa y sc inf para todo x∈X,

Sea fy(.) una función cóncava y sc sup para todo y∈Y,

Entonces, se tiene que:

Homenaje a Marco A. López Cerdá. Alacant 2010 12

nm YX ℜ∈ℜ∈ ,

ℜ→×YXf :

),()(,: yxfyfYf xx =ℜ→

),()(,: yxfxfXf yy =ℜ→

),(maxmin),(minmax yxfyxf XxYyYyXx ∈∈∈∈ =

Page 13: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

13

Teorema General del MinimaxSe sigue de la demostración que existe un punto de silla

(x0,y0) de la función f(x,y).

Para un juego rectangular (X,Y,A) con función de pago

f(x,y)=xTAy, se demuestra que x0 es una estrategia

maximin e y0 es una estrategia minimax, cumpliéndose

que

Los conjuntos de estrategias óptimas son:

Homenaje a Marco A. López Cerdá. Alacant 2010 13

),(min),(max 00 yxfvyxf YyXx ∈∈ ==

⎭⎬⎫

⎩⎨⎧

≤=≥ℜ∈=⎭⎬⎫

⎩⎨⎧

≥=≥ℜ∈= ∑∑==

n

j

Tjj

nm

i

Tii

m vvyAyyyYevvAxxxxX11

),...(,1,0:),...(,1,0:

Page 14: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

14

Determinación de estrategias óptimasDado que los conjuntos de estrategias óptimas son poliedros acotados no vacios, para su determinación serásuficiente calcular las estrategias óptimas básicas.

Teorema (Shapley and Snow, 1950) Para un juego rectangular (X,Y,A) con valor v≠0. Las estrategias óptimas

son básicas si, y solo si, existen S⊂{1,…,m} y T⊂{1,…,n} tales que la submatriz es regular,

Homenaje a Marco A. López Cerdá. Alacant 2010 14

YXyx ×∈),(

STA

,0 TjvAxySix jT

i ∈∀=∉∀=

.0 SivyAyTjy ij ∈∀=∉∀=

Page 15: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

15

Determinación de estrategias óptimasAplicando el siguiente procedimiento iterativo se determina tanto el valor del juego como las estrategias óptimas básicas:

Calcular todas las submatrices M (sxs) regulares de A

Comprobar si se satisfacen simultáneamente:

Tendríamos una solución óptima, siendo básicas las estrategias óptimas obtenidas.

Homenaje a Marco A. López Cerdá. Alacant 2010 15

sTs uMu

vi 1

1)( −=

vuAxMvuxii Tn

TTs

Ts ≥= − ceroscon ocompletand,Para)( 1

vuAyMvuyiii mTs

Ts ≤= − ceroscon ocompletand,Para)( 1

Page 16: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

16

Juegos rectangulares y PLLa equivalencia existente entre un juego rectangular y un

par de programas lineales duales simétricos fue

establecida por Dantzig en 1951.

Determinar las estrategias óptimas de los jugadores I y II

se sigue de la resolución de los programas

En particular, resulta más sencillo obtener las estrategias

optimas resolviendo el PL asociado al jugador II.Homenaje a Marco A. López Cerdá. Alacant 2010 16

m

Tn

Tm

T

xuAxas

uxMinI

0..

)(

≥≥

n

m

Tm

yuAyasyuMaxII

0..

)(

≥≤

Page 17: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

17

Juegos semi-infinitosUn juego bipersonal de suma nula semi-infinito estádefinido por un conjunto de vectores Los conjuntos de estrategias puras sonLa matriz semi-infinita de pagos seriaEste tipo de juegos ha sido tratado por Soyster (1975), cuando T es numerable, aplicando resultados de dualidad sobre conos.Tijs (1979) aplica técnicas de aproximación, usando subprogramas lineales finitos, para dar una demostración alternativa del teorema del minimax y prueba que el jugador II siempre tiene estrategias óptimas.

Homenaje a Marco A. López Cerdá. Alacant 2010 17

{ } nt Tta ℜ⊂∈,

{ }nETE ,...,1y 21 ==

tjajtP =),(

Page 18: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

18Homenaje a Marco A. López Cerdá. Alacant 2010

Si los jugadores I y II eligen una distribución de probabilidad discreta sobre sus correspondientes conjuntos de estrategias puras, se sigue que los conjuntos de estrategias mixtas son:

Jugador I: Γ={λ= (λt)t ∈T/ nº finito de λt≠0, λt ≥0 y ∑ t ∈T λt=1}

Jugador II: Y:={y∈Rn/ ∑ i=1,..,n yi=1, yi ≥0}

Función de pago del jugador I: P(λ, y)= ∑ t ∈T λt at´y λ ∈ Γ, y ∈ Y

Los valores maximin y minimax:

vI:=sup λ ∈Γ{minj=1,..,n P(λ, ej)} vII:= inf y∈Y {sup t ∈T at´y }

Juegos semi-infinitos lineales

Page 19: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

19Homenaje a Marco A. López Cerdá. Alacant 2010

Aplicando el Teorema de alternativa generalizado de Stiemke: (I) ⇔ no (II) (López y Vercher, 1983), siendo

se demuestra que:• Teorema del minimax. Cualquier juego semi-infinito lineal verifica vI=vII.• Para cualquier juego con valor finito el jugador II siempre tiene estrategias óptimas.

• Condiciones adicionales para que el jugador I tenga estrategias óptimas. Por ejemplo, que el conjunto de vectores {at, t ∈ T} sea compacto (Goberna et al, 1984).

Juegos semi-infinitos lineales

{ } algun t para0 que talsolución una tiene,0)( 00 ≠∈≤ xaxTtxaI Tt

Tt

{ }( )TtacorII tn ∈∈ ,int0)(

Page 20: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

20Homenaje a Marco A. López Cerdá. Alacant 2010

Juegos semi-infinitos convexosSea FT={ft, t ∈T} familia de funciones convexas. Una estrategia pura del jugador I consiste en elegir una función de FT.Los conjuntos de estrategias mixtas se definen:

• Jugador I: Γ={λ= (λt)t ∈T/nº finito λt≠0, λt ≥0, ∑ t ∈T λt=1}• Jugador II: C:=conjunto cerrado convexo no vacio de Rn

Función de pago del jugador I: P(λ, x)= ∑ t ∈T λt ft(x) λ ∈ Γ, x ∈ C

Los valores maximin y minimax son:vI:=sup l ∈G{inf x∈C P(λ, x)} vII:= inf x∈C {sup t ∈T ft(x)}

Page 21: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

Homenaje a Marco A. López Cerdá. Alacant 2010 21

Condición (R). Las funciones convexas en FT no tienen ninguna dirección de recesión común con las direcciones de recesión de C, i.e. 0+C∩(∩ t ∈T rec ft) = {0}

Teorema (López y Vercher, 1986) Sea (FT, C) un juego semi-infinito que verifique la condición (R), entonces una y solo una de las siguientes alternativas se cumple:

• Existe un vector x∈C tal que ft(x)≤0 para todo t ∈T

• Existen λ= (λt)t ∈T/nº finito λt≠0, λt ≥0, tales que para

algun ξ>0 se tiene que ∑ t ∈T λt ft(x) ≥ ξ, para todo x∈C

Teorema del Minimax

Page 22: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

22Homenaje a Marco A. López Cerdá. Alacant 2010

Teorema del minimax (López y Vercher, 1986) Para cualquier juego semi-infinito (FT, C) que verifique la condición (R): vI=vII.

Se ha demostrado que:• Para cualquier (R)-juego semi-infinito, cuyo valor del juego es finito, el jugador II siempre tiene estrategias óptimas.

• En las condiciones anteriores, si el conjunto de vectores L(FT) es compacto (por ejemplo), también el conjunto de estrategias óptimas del jugador I es no vacio.

Siendo

Teorema del Minimax

1** ),(,

)()( +ℜ⊂

⎭⎬⎫

⎩⎨⎧

∈∈⎥⎦

⎤⎢⎣

⎡= n

ttt

tT Ttfdomu

ufu

FL

Page 23: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

23Homenaje a Marco A. López Cerdá. Alacant 2010

Las estrategias óptimas de los juegos (FT, C) que verifican la condición (R) y tienen valor cero admiten una curiosa interpretación geométrica:

• Los únicos hiperplanos que separan L(FT) e hipo IC, siendo IC(u):= inf x∈C u´x, tienen la ecuación

donde x* es una estrategia óptima de II.• Si L(FT) es compacto: hipo IC∩co(L(FT) )≠∅. Los vectores que pertenecen a esta intersección son

[ ] 01*, =⎥⎦

⎤⎢⎣

⎡−

ρu

x

∑ ∑∈ ∈

⎥⎦

⎤⎢⎣

⎡=⎥

⎤⎢⎣

Tt tc

t

t

fdomuu uf

uuc

tt

t )()(

λρ

y λ=(λ t) t ∈T es un estrategia óptima del jugador I.

∑∈

λ=λ)f(domu

utctt

t

Estrategias óptimas

Page 24: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

24Homenaje a Marco A. López Cerdá. Alacant 2010

Si T es el conjunto de estrategias puras del jugador I. Si T es un conjunto compacto convexo de Rm hemos caracterizado la existencia de estrategias puras óptimas:

• Sea (FT, C) un juego que verifica la condición (R), tal que(i) ft(x) es cóncava en t y cont sobre T, para x ∈ C.

Entonces, el valor del juego es finito y el jugador I tiene estrategias puras óptimas.

• Sea (FT, C) un juego convexo, siendo C compacto tal que(i) ft(x) es continua sobre T, para cada x ∈ C(ii) T(x):={t ∈ T/ft(x)=max t ∈ T ft(x)} es convexo.

Entonces, el valor del juego es finito y el jugador I tiene estrategias puras óptimas.

Estrategias puras óptimas

Page 25: yJuegos bipersonales de suma nula yJuegos semi-infinitos · 2015-07-22 · • Juegos n-personales • Juegos bipersonales • finitos • rectangulares de suma nula • cooperativos:

25Homenaje a Marco A. López Cerdá. Alacant 2010

Referencias• G. B. Dantzig, en Activity Analysis of Production and Allocation, Koopmans(ed), Wiley 1951. • M. A. Goberna, M.A.Lopez . J. Pastor and E. Vercher (1984) Nieuw Archiefvoor Wiskunde (4) 2, 218-234.• M. A. Lopez and E. Vercher (1983) Cuadernos de Bioestadística y sus Aplicaciones Informáticas I, 260-266.• M. A. Lopez and E. Vercher (1986) Journal of Optimization Theory and Applications 50, 289-312• G. Owen, Game Theory, Saunders,1968. • T. Parthasarathy and T. E. S. Raghavan, Some topics in two-person games, American Elsevier 1971.• R. T. Rockafellar, Convex Analysis, Princeton Univ. Press, 1970. • L. S. Shapley and R. N. Snow, en Contributions to the theory of games, vol. I, Kuhn and Tucker (eds), Princeton Univ. Press, 1950.• A. L. Soyster (1975) Management Science 21, 806-812• S. H. Tijs (1979) Nieuw Archief voor Wiskunde 27, 197-214• J. Von Neumann (1928) Mathematische Annalen 100, 295-320• J. Von Neumann and O. Morgenstern, Theory of games and Economicbehavior, Princeton Univ. Press, 1970.