introducción a la teoría de juegos

24
Introducción a la teoría de juegos Los psicólogos destacan la importancia del juego en la infancia como medio de formar la personalidad y de aprender de forma experimental a relacionarse en sociedad, a resolver problemas y situaciones conflictivas. Todos los juegos, de niños y de adultos, juegos de mesa o juegos deportivos, son modelos de situaciones conflictivas y cooperativas en las que podemos reconocer situaciones y pautas que se repiten con frecuencia en el mundo real. El estudio de los juegos ha inspirado a científicos de todos los tiempos para el desarrollo de teorías y modelos matemáticos. La estadística es una rama de las matemáticas que surgió precisamente de los cálculos para diseñar estrategias vencedoras en juegos de azar. Conceptos tales como probabilidad, media ponderada y distribución o desviación estándar, son términos acuñados por la estadística matemática y que tienen aplicación en el análisis de juegos de azar o en las frecuentes situaciones sociales y económicas en las que hay que adoptar decisiones y asumir riesgos ante componentes aleatorios. Pero la teoría de juegos tiene una relación muy lejana con la estadística. Su objetivo no es el análisis del azar o de los elementos aleatorios sino de los comportamientos estratégicos de los jugadores. En el mundo real, tanto en las relaciones económicas como en las políticas o sociales, son muy frecuentes las situaciones en las que, al igual que en los juegos, su resultado depende de la conjunción de decisiones de diferentes agentes o jugadores. Se dice de un comportamiento que es estratégico cuando se adopta teniendo en cuenta la influencia conjunta sobre el resultado propio y ajeno de las decisiones propias y ajenas. La técnica para el análisis de estas situaciones fue puesta a punto por un matemático, John von Neumann. A comienzos de la década de 1940

Upload: jose-miguel-mejia-medina

Post on 22-Nov-2015

32 views

Category:

Documents


0 download

TRANSCRIPT

Introduccin a la teora de juegosLos psiclogos destacan la importancia del juego en la infancia como medio de formar la personalidad y de aprender de forma experimental a relacionarse en sociedad, a resolver problemas y situaciones conflictivas.Todos los juegos,de nios y de adultos, juegos de mesa o juegos deportivos,son modelos de situaciones conflictivas y cooperativasen las que podemos reconocer situaciones y pautas que se repiten con frecuencia en el mundo real.El estudio de los juegos ha inspirado a cientficos de todos los tiempos para el desarrollo de teoras y modelos matemticos. Laestadsticaes una rama de las matemticas que surgi precisamente de los clculos para disear estrategias vencedoras en juegos de azar. Conceptos tales como probabilidad, media ponderada y distribucin o desviacin estndar, son trminos acuados por la estadstica matemtica y que tienen aplicacin en el anlisis de juegos de azar o en las frecuentes situaciones sociales y econmicas en las que hay que adoptar decisiones y asumir riesgos ante componentes aleatorios.

Pero lateora de juegostiene una relacin muy lejana con la estadstica. Su objetivo no es el anlisis del azar o de los elementos aleatorios sino de los comportamientos estratgicos de los jugadores. En el mundo real, tanto en las relaciones econmicas como en las polticas o sociales, son muy frecuentes las situaciones en las que, al igual que en los juegos, su resultado depende de la conjuncin de decisiones de diferentes agentes o jugadores. Se dice de un comportamiento que es estratgico cuando se adopta teniendo en cuenta la influencia conjunta sobre el resultado propio y ajeno de las decisiones propias y ajenas.La tcnica para el anlisis de estas situaciones fue puesta a punto por un matemtico,John von Neumann. A comienzos de la dcada de 1940 trabaj con el economistaOskar Morgensternen las aplicaciones econmicas de esa teora. El libro que publicaron en 1944,"Theory of Games and Economic Behavior", abri un insospechadamente amplio campo de estudio en el que actualmente trabajan miles de especialistas de todo el mundo.La Teora de Juegos ha alcanzado un alto grado de sofisticacin matemtica y ha mostrado una gran versatilidad en la resolucin de problemas. Muchos campos de la Economa Equilibrio General, distribucin de costes, etc. se han visto beneficiados por las aportaciones de este mtodo de anlisis. En el medio siglo transcurrido desde su primera formulacin el nmero de cientficos dedicados a su desarrollo no ha cesado de crecer. Y no son slo economistas y matemticos sino socilogos, politlogos, bilogos o psiclogos. Existen tambin aplicaciones jurdicas: asignacin de responsabilidades, adopcin de decisiones de pleitear o conciliacin, etc.Hay dos clases de juegos que plantean una problemtica muy diferente y requieren una forma de anlisis distinta. Si los jugadores pueden comunicarse entre ellos y negociar los resultados se tratar dejuegos con transferencia de utilidad(tambin llamadosjuegos cooperativos), en los que la problemtica se concentra en el anlisis de las posibles coaliciones y su estabilidad. En los juegos sin transferencia de utilidad, (tambin llamadosjuegos no cooperativos) los jugadores no pueden llegar a acuerdos previos; es el caso de los juegos conocidos como "la guerra de los sexos", el "dilema del prisionero" o el modelo "halcn-paloma".Los modelos de juegos sin transferencia de utilidad suelen serbipersonales, es decir, con slo dos jugadores. Pueden sersimtricosoasimtricossegn que los resultados sean idnticos desde el punto de vista de cada jugador. Pueden ser desuma cero, cuando el aumento en las ganancias de un jugador implica una disminucin por igual cuanta en las del otro, o desuma no nulaen caso contrario, es decir, cuando la suma de las ganancias de los jugadores puede aumentar o disminuir en funcin de sus decisiones. Cada jugador puede tener opcin slo a dos estrategias, en losjuegos biestratgicos, o a muchas. Las estrategias pueden serpurasomixtas; stas consisten en asignar a cada estrategia pura una probabilidad dada. En el caso de losjuegos con repeticin, los que se juegan varias veces seguidas por los mismos jugadores, las estrategias pueden ser tambinsimplesoreactivas, si la decisin depende del comportamiento que haya manifestado el contrincante en jugadas anteriores.

Otros artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn Ejercicios MAXIMN El dilema del prisionero El modelo Halcn-Paloma La guerra de los sexos Juegos con transferencia de utilidad Estrategias reactivasAplicaciones El duopolio en la teora de juegos Las especies en peligroy los recursos naturales La tragedia de los comunes y el origen del derecho El equilibrio de Nash y las polticas macroeconmicasBernard GuerrienLA TEORA DE JUEGOS1.LAS SITUACIONES DE JUEGO2.EL EQUILIBRIO DE NASH3.JUEGOS REPETIDOS4.LOS JUEGOS CON INFORMACIN INCOMPLETA.John von Neumann1903-1957Oskar Morgenstern1902-1976

En 1944, John von Neumann y Oskar Morgenstern publicaron su libro "Theory of Games and Economic Behavior" iniciando as la aplicacin de la Teora de Juegos al anlisis econmico.

John C. Harsanyi1920 -2000John F. Nash1928 -Reinhard Selten1930 -

En 1994 se concedi el Premio Nobel de Economa a Harsanyi, Nash y Selten por sus pioneros anlisis del equilibrio en la teora de los juegos no cooperativos.

Aumann, Robert J. (1930-)Schelling, Thomas C.1921-

En 2005 se concedi el Premio Nobel de Economa a Rober J. Aumann y Thomas C. Schelling "por haber ampliado nuestra comprensin del conflicto y la cooperacin mediante el anlisis de la Teora de los Juegos".

Introduccin a la teora de juegosLa estrategia Maximnjuego de suma ceroestrategiaspagomatriz de pagospunto de sillasolucin estableminimaxestrategias mixtasteorema del minimax

Consideremos unjuego de suma ceroen el que lo que yo gano lo pierde el otro jugador. Cada jugador dispone de tresestrategiasposibles a las que designaremos como A, B, y C (supongamos que son tres tarjetas con dichas letras impresas). Los premios opagosconsisten en la distribucin de diez monedas que se repartirn segn las estrategias elegidas por ambos jugadores y se muestran en la siguiente tabla llamadamatriz de pagos. Mis ganancias, los pagos que puedo recibir, se muestran en verde, a la izquierda de cada casilla. Los pagos al otro jugador se muestran en rosa, a la derecha de cada casilla. Para cualquier combinacin de estrategias, los pagos de ambos jugadores suman diez.MATRIZ DE PAGOS

Las estrategiasdel otro jugador

ABC

Mi estrategiaA9|11|92|8

B6|45|54|6

C7|38|23|7

Por ejemplo. Si yo juego la tarjeta C y el otro jugador elige su tarjeta B entonces yo recibir ocho monedas y el otro jugador recibir dos.ste es por tanto un juego de suma cero. Se llamajuego de suma ceroaqul en el que lo que gana un jugador es exactamente igual a lo que pierde o deja de ganar el otro.Para descubrir qu estrategia me conviene ms vamos a analizar la matriz que indica mis pagos, la de fondo verde. Ignoro cul es la estrategia (la tarjeta) que va a ser elegida por el otro jugador. Una forma de analizar el juego para tomar mi decisin consiste en mirar cul es elmnimoresultado que puedo obtener con cada una de mis cartas. En la siguiente tabla se ha aadido una columna indicando mis resultados mnimos.MATRIZ DE MIS PAGOS

La estrategia del otro jugador

ABCmnimos

Mi estrategiaA9121

B6544

C7833

En efecto, Si yo elijo la tarjeta A, puedo obtener 9, 1 o 2, luego como mnimo obtendr un resultado de1. Si elijo la tarjeta B, puedo obtener 6, 5 o 4, luego como mnimo obtendr4. Si elijo la tarjeta C, puedo obtener 7, 8 o 3, luego como mnimo obtendr3.De todos esos posibles resultados mnimos, el que prefiero es4ya que es elmximo de los mnimos. La estrategiaMAXIMINconsiste en elegir la tarjetaBya que esa estrategia me garantiza que, como mnimo, obtendr4.Podemos prever la estrategia del otro jugador? Supongamos que el otro jugador quiere elegir tambin su estrategia MAXIMIN. Mostramos ahora slo los pagos asignados al otro jugador en los que destacamos el pago mnimo que puede obtener para cada una de sus estrategias. Subrayamos el mximo de los mnimos y su estrategia maximin.MATRIZ DE PAGOS AL OTRO JUGADOR

La estrategia del otro jugador

ABC

Mi estrategiaA198

B456

C327

mnimos126

En efecto, Si l elige A, su peor resultado sera si yo elijo A con lo que yo obtendra9y l1. Si l elige B, su peor resultado sera si yo elijo C con lo que yo obtendra8y l2. Si l elige C, su peor resultado sera si yo elijo B con lo que yo obtendra4y l6.Su estrategia MAXIMIN consiste por tanto en jugar la cartaCcon lo que se garantiza que, al menos, obtendr6.ste es un juego consolucin estable. Ninguno de los jugadores siente la tentacin de cambiar de estrategia. Supongamos que se empieza a repetir el juego una y otra vez. Yo jugar siempre mi estrategia maximin (B) y el otro jugar siempre su estrategia maximin (C). Cada uno sabe lo que jugar el otro la siguiente vez. Ninguno estar tentado de cambiar su estrategia ya que el que decida cambiar su estrategia perder.Se llamapunto de sillaal resultado en el que coinciden las estrategias maximin de ambos jugadores.No todos los juegos tienen un punto de silla, una solucin estable. La estabilidad del juego anterior desaparece simplemente trastocando el orden de las casillas BB y BC:MATRIZ DE MIS PAGOSMATRIZ DE PAGOS AL OTRO JUGADOR

La estrategia del otro jugadorLa estrategia del otro jugador

ABCABC

Mi estrategiaA912Mi estrategiaA198

B645B465

C783C327

En esta nueva tabla mi estrategia maximin sigue siendo la B y la estrategia maximin del otro jugador sigue siendo la C. Pero la solucin ahora ya no es estable. Si jugamos repetidas veces y yo repito mi estrategia maximn, B, el otro estar tentado de cambiar su estrategia, pasando de la C a la B con lo que obtendr un pago mayor, 6 en vez de 5.Claro que si el otro empieza a elegir sistemticamente la estrategia B yo preferir cambiar mi estrategia a la C para as obtener 8. Entonces el querr volver a su estrategia C y as sucesivamente.Realice ahora estosEjercicios MAXIMNCuando se repiten juegos que no tienen solucin estable interesa utilizar estrategias mixtas. Lasestrategias mixtasconsisten en asignar a cada una de las estrategias una probabilidad. En el juego que estamos analizando una estrategia mixta podra describirse de la forma siguiente: "Para elegir la tarjeta que voy a jugar lanzar un dado. Si el dado muestra un 1, elegir la tarjeta A; si el dado muestra un 2 o un 3, elegir la tarjeta B; si el dado muestra un 4, un 5 o un 6, elegir la tarjeta C". En otras palabras, elegir la tarjeta A con una probabilidad de 1/6, la tarjeta B con una probabilidad de 1/3 y la tarjeta C con una probabilidad de 1/2.Elteorema del maximinafirma que en todo juego bipersonal de suma cero en el que sea posible jugar estrategias mixtas adems de las puras, las estrategias maximin de cada jugador coincidirn siempre en una solucin estable, un punto de silla. Este teorema fue demostrado matemticamente porJohn von Neumannen un artculo publicado en 1928.

Otros artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn El dilema del prisionero El modelo Halcn-Paloma La guerra de los sexos Juegos con transferencia de utilidad Estrategias reactivasAplicaciones El duopolio en la teora de juegos Las especies en peligroy los recursos naturales La tragedia de los comunes y el origen del derecho El equilibrio de Nash y las polticas macroeconmicas

El Dilema del PrisioneroEl Dilema del Prisionero (Prisoner's dilemma) es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la Teora de Juegos.Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo del banco, delito cuya pena es diez aos de crcel, pero no tiene pruebas. Slo tiene pruebas y puede culparles de un delito menor, tenencia ilcita de armas, cuyo castigo es de dos aos de crcel. Promete a cada uno de ellos que reducir su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco.Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compaero. Llamaremos "traicin" a la estrategia alternativa.

Dilema del prisioneroMatriz de Pagos(aos de crcel)

Preso Y

lealtadtraicin

Preso Xlealtad2\210\1

traicin1\105\5

Los pagos a la izquierda o a la derecha de la barra indican los aos de crcel a los que es condenado el preso X o Y respectivamente segn las estrategias que hayan elegido cada uno de ellos.

En vez de expresar los pagos en aos de crcel, podramos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicacin ms general.Dilema del prisioneroMatriz de Pagos(orden de preferencias)

Preso Y

lealtadtraicin

Preso Xlealtad2\24\1

traicin1\43\3*

La aplicacin de laestrategia maximnconduce en este juego a un resultado subptimo. Al no conocer la decisin del otro preso, la estrategia ms segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es unpunto de equilibrio de Nashy est sealado en la matriz mediante un asterisco.El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula, bipersonal, biestratgico y simtrico. Fue formalizado y analizado por primera vez por A. W. Tucker en 1950. Es posiblemente el juego ms conocido y estudiado en la teora de juegos. En base a l se han elaborado multitud de variaciones, muchas de ellas basadas en la repeticin del juego y en el diseo de estrategias reactivas.

Otros artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn Ejercicios MAXIMN El dilema del prisionero El modelo Halcn-Paloma La guerra de los sexos Juegos con transferencia de utilidad Estrategias reactivasAplicaciones El duopolio en la teora de juegos Las especies en peligroy los recursos naturales La tragedia de los comunes y el origen del derecho El equilibrio de Nash y las polticas macroeconmicasEl modelo halcn-palomaEn el lenguaje ordinario entendemos por "halcn" a los polticos partidarios de estrategias ms agresivas mientras que identificamos como "paloma" a los ms pacifistas. El modelo Halcn-Paloma sirve para analizar situaciones de conflicto entre estrategias agresivas y conciliadoras. Este modelo es conocido en la literatura anglosajona como el "hawk-dove" o el "chicken" y en espaol es conocido tambin como "gallina".

En la filmografa holywoodiense se han representado en varias ocasiones desafos de vehculos enfrentados que siguen este modelo. Los dos vehculos se dirigen uno contra otro en la misma lnea recta y a gran velocidad. El que frene o se desve ha perdido. Pero si ninguno de los dos frena o se desva...Tambin se ha utilizado este modelo abundantemente para representar una guerra fra entre dos superpotencias. La estrategia Halcn consiste en este caso en proceder a una escalada armamentstica y blica. Si un jugador mantiene la estrategia Halcn y el otro elige la estrategia Paloma, el Halcn gana y la Paloma pierde. Pero la situacin peor para ambos es cuando los dos jugadores se aferran a la estrategia Halcn. El resultado puede modelizarse con la siguiente matriz de pagos.HALCN-PALOMA:MATRIZ DE PAGOS

Jugador Y

PalomaHalcn

Jugador XPaloma2,23,1*

Halcn1,3*4,4

Obsrvense las sutiles pero importantes diferencias de este modelo con el Dilema del Prisionero. En principio la matriz es muy parecida, simplemente se han trocado las posiciones de los pagos 3 y 4, pero la solucin y el anlisis son ahora muy diferentes.Hay aqu dos resultados que son equilibrios de Nash: cuando las estrategias elegidas por cada jugador son diferentes; en la matriz aqu representada esas soluciones estn marcadas con un asterisco. Comprubese, por el contrario, que en el Dilema del Prisionero el equilibrio de Nash est en el punto en que ambos jugadores traicionan.Otra notable diferencia de este juego con otros es la importancia que aqu adquiere el orden en que los jugadores eligen sus estrategias. Como tantas veces en la vida real, el primero que juega, gana. El primero elegir y manifestar la estrategia Halcn con lo que el segundo en elegir se ver obligado a elegir la estrategia Paloma, la menos mala.Otros artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn Ejercicio MAXIMN El dilema del prisionero El modelo Halcn-Paloma La guerra de los sexos Juegos con transferencia de utilidad Estrategias reactivasAplicaciones El duopolio en la teora de juegos Las especies en peligroy los recursos naturales La tragedia de los comunes y el origen del derecho El equilibrio de Nash y las polticas macroeconmicasLa guerra de los sexosjuegos sin repeticinjuegos sin transferencia de utilidadresultado subptimojuego simtricojuego asimtricopunto de sillasolucin establemaximndominacin

El juego de "La guerra de los sexos" es un ejemplo muy sencillo de utilizacin de modelos de la teora de juegos para analizar un problema frecuente en la vida cotidiana.Hay dos jugadores: "L" y "ELLA". Cada uno de ellos puede elegir entre dos posibles estrategias a las que llamaremos "Ftbol" y "Discoteca".Supongamos que el orden de preferencias de L es el siguiente:1(lo ms preferido) L y ELLA eligen Ftbol.2L y ELLA eligen Discoteca.3L elige Ftbol y ELLA elige Discoteca.4(lo menos preferido) l elige Discoteca y ELLA elige Ftbol.Supongamos que el orden de preferencias de ELLA es el siguiente:1(lo ms preferido) L y ELLA eligen Discoteca.2L y ELLA eligen Ftbol.3L elige Ftbol y ELLA elige Discoteca.4(lo menos preferido) l elige Discoteca y ELLA elige Ftbol.La matriz de pagos es como sigue:ELLA

FtbolDiscoteca

LFtbol1\23\3*

Discoteca4\42\1

Los pagos representan el orden de preferencias.En verde y a la izquierda de la barra, los pagos a L.En violeta y a la derecha de la barra los pagos a ELLA.

Este juego, tal como lo hemos descrito, es un juegosin repeticinysin transferencia de utilidad. Sin repeticin significa que slo se juega una vez por lo que no es posible tomar decisiones en funcin de la eleccin que haya hecho el otro jugador en juegos anteriores. Sin transferencia de utilidad significa que no hay comunicacin previa por lo que no es posible ponerse de acuerdo, negociar ni acordar pagos secundarios ("Si vienes al ftbol te pago la entrada").El problema que se plantea es simplemente un problema de coordinacin. Se trata de coincidir en la eleccin. Al no haber comunicacin previa, es posible que el resultado no sea ptimo. Si cada uno de los jugadores elige suestrategia maximnel pago que recibirn (3\3) essubptimo. Esa solucin, marcada en la matriz con un asterisco,no esunpunto de equilibrio de Nashya que los jugadores estn tentados de cambiar su eleccin: cuando ELLA llegue a la discoteca y observe que L se ha ido al ftbol, sentir el deseo de cambiar de estrategia para obtener un pago mayor.

El modelo que hemos visto es unjuego simtricoya que jugadores o estrategias son intercambiables sin que los resultados varen. Podemos introducir una interesante modificacin en el juego convirtindolo en asimtrico a la vez que nos aproximamos ms al mundo real. Supongamos que las posiciones 2 y 3 en el orden de preferencias de L se invierten. L prefiere ir solo al Ftbol ms que ir con ELLA a la Discoteca. La matriz de pagos queda como sigue:ELLA

FtbolDiscoteca

LFtbol1\2*2\3

Discoteca4\43\1

Si ELLA conoce la matriz de pagos, es decir, las preferencias de L, el problema de coordinacin desaparece. Est muy claro que L elegir siembre la estrategia Ftbol, sea cual sea la eleccin de ELLA. Sabiendo esto ELLA elegir siempre la estrategia Ftbol tambin, ya que prefiere estar con L aunque sea en el Ftbol que estar sola aunque sea en la Discoteca. La estrategia maximn de ambos jugadores coincide. El resultado, marcado con un asterisco, es un ptimo, un punto de silla, una solucin estable,un punto de equilibrio de Nash. Obsrvese que esta solucin conduce a una situacin estable de dominacin social del jugador que podramos calificar como el ms egosta.

Otros artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn El dilema del prisionero El modelo Halcn-Paloma La guerra de los sexos Juegos con transferencia de utilidad Estrategias reactivasAplicaciones El duopolio en la teora de juegos Las especies en peligroy los recursos naturales La tragedia de los comunes y el origen del derecho El equilibrio de Nash y las polticas macroeconmicasJuegos con transferencia de utilidad(Juegos cooperativos)Si los jugadores pueden comunicarse entre s y negociar un acuerdo ANTES de los pagos, la problemtica que surge es completamente diferente. Se trata ahora de analizar la posibilidad de formar una coalicin de parte de los jugadores, de que esa coalicin sea estable y de cmo se deben repartir las ganancias entre los miembros de la coalicin para que ninguno de ellos est interesado en romper la coalicin.

Juego 1.- Empecemos con el ejemplo ms sencillo. Supongamos que tres jugadores, Ana, Benito y Carmen, tienen que repartirse entre s cien euros. El sistema de reparto tiene que ser adoptado democrticamente, por mayora simple, una persona un voto. Hay cuatro posibles coaliciones vencedoras: ABC, AB, BC y AC, pero hay infinitas formas de repartir los pagos entre los tres jugadores.

Supongamos que Ana propone un reparto de la forma A=34, B=33 y C=33.Benito puede proponer un reparto alternativo de la forma A=0, B=50 y C=50Carmen estar ms interesada en la propuesta de Benito que en la de Ana. Pero puede proponer una alternativa an mejor para ella: A=34, B=0 y C=66.A Benito es posible que se le ocurra alguna propuesta mejor para atraer a Ana.El juego puede continuar indefinidamente. No tiene solucin. No hay ninguna coalicin estable. Sea cual sea la propuesta que se haga siempre habr una propuesta alternativa que mejore los pagos recibidos por cada jugador de una nueva mayora.Definicin: En los juegos con transferencia de utilidad se llama solucin a una propuesta de coalicin y de reparto de los pagos que garantice estabilidad, es decir, en la que ninguno de los participantes de una coalicin vencedora pueda estar interesado en romper el acuerdo.

Juego 2.- Modifiquemos ahora el ejemplo. En vez de "un hombre un voto" consideremos que hay voto ponderado. Ana tiene derecho a seis votos, Benito a tres y Carmen a uno. Las posibles mayoras son las siguientes: ABC, AB, AC, A.En esta situacin Ana propondr un reparto de la siguiente forma: A=100, B=0 y C=0. Ese reparto se corresponde con una coalicin estable en la que los seis votos de Ana estarn a favor. Es una solucin nica. Ana no aceptar ningn reparto en el que ella obtenga menos de 100 euros y sin la participacin de Ana no hay ninguna coalicin vencedora.Definicin: Se llama "valor del juego" al pago que un jugador tiene garantizado que puede recibir de un juego si toma una decisin racional, independientemente de las decisiones de los dems jugadores. Ningn jugador aceptar formar parte de una coalicin si no recibe como pago al menos el valor del juego.

En el juego 1, el valor del juego es cero para los tres jugadores. En el juego 2 el valor del juego para Ana es cien y para Benito y Carmen es cero.

Juego 3.- Pongamos un ejemplo algo ms realista y, por tanto, un poco ms complejo. Supongamos un municipio en el que cinco partidos polticos se han presentado a las elecciones: el Partido Austero (PA), el Partido Benefactor (PB), el Partido Comunal (PC), el Partido Democrtico (PD) y el Partido de la Esperanza (PE). En laselecciones, han obtenido el siguiente nmero de concejales:PA=11PB=8PC=5PD=2PE=1Como ningn partido ha conseguido la mayora absoluta, es necesario que se forme una coalicin para gobernar el municipio. El presupuesto anual del municipio es de 520 millones de euros. La coalicin gobernante debe asignar los cargos y las responsabilidades del ayuntamiento a los diferentes partidos. En las negociaciones se debe acordar el reparto del presupuesto, cargos y responsabilidades entre los partidos. Suponemos que no hay simpatas ni antipatas ideolgicas y que los cargos y responsabilidades son valorados exclusivamente segn el presupuesto econmico que controlan. Supondremos, para simplificar, que hay disciplina de voto y que no son posibles las traiciones internas

Anlisis del juego 3. Como el nmero total de concejales es 27, la coalicin vencedora debe disponer al menos de 14 votos. A diferencia deljuego 2, no hay ningn jugador imprescindible para ganar. Si utilizamos la definicin que dimos arriba, el valor del juego para todos los jugadores es cero ya que ninguno tiene garantizada su pertenencia a la coalicin vencedora.Definicin: Se llama "valor de Shapley" a la asignacin que recibe cada jugador en una propuesta de reparto segn un criterio de arbitraje diseado por Lloyd S. Shapley. El criterio consiste en asignar un pago a cada jugador en proporcin al nmero de coaliciones potencialmente vencedoras en las que el jugador participa de forma no redundante.

Un jugador es redundante en una coalicin si no es imprescindible para que esa coalicin resulte vencedora.Propuesta arbitral de Shapley para el juego 3.Como hay cinco partidos polticos, las posibles coaliciones son 31. De ellas, 16 son vencedoras. Las coaliciones perdedoras estn en rojo. En las coaliciones vencedoras se han marcado en amarillo los jugadores redundantes.ABCDE

ABCDABCEABDEACDEBCDEABCABDACDBCDABEACEBCEADEBDECDE

ABACADAEBCBDBECDCEDEABCDE

Por tanto:A no es redundante en 10 coaliciones vencedorasB no es redundante en 6 coaliciones vencedorasC no es redundante en 6 coaliciones vencedorasD no es redundante en 2 coaliciones vencedorasE no es redundante en 2 coaliciones vencedorasSi se formara un "gobierno de concentracin", una coalicin de todos los partidos, podramos repartir el presupuesto de 520 millones de euros en proporcin al valor de Shapley obteniendo los siguientes valores para cada uno de los partidos:A= 200; B= 120; C= 120; D= 40; E= 40En cualquier coalicin formada por menos de cinco partidos, ninguno de los coaligados debera aceptar un presupuesto inferior al indicado. Sea cual sea la coalicin vencedora que se forme, el presupuesto puede ser repartido conforme al criterio del valor de Shapley.Obsrvese que la propuesta de arbitraje de Shapley no conduce a una solucin nica ni absolutamente estable. Sigue habiendo varias soluciones posibles. Pero en cualquier coalicin que se forme, si el reparto se hace conforme al criterio de Shapley, no habr una coalicin alternativa ms estable que ofrezca a los jugadores un pago superior.Hemiciclo del Parlamento Europeo en su sede de Estrasburgo

Nmero de representantesen el Parlamento Europeoa partir de enero de 2004

Austria17

Alemania99

Blgica22

Dinamarca13

Espaa50

Finlandia13

Francia72

Grecia22

Holanda25

Irlanda12

Italia72

Luxemburgo6

Portugal22

Reino Unido72

Suecia18

Juego 4.Ejercicio.En el Tratado de la Unin Europea aprobado en Niza en diciembre de 2000 se acord que apartir del 1 de enero de 2004, el nmero de representantes de cada pas miembro en el Parlamento Europeo ser el fijado en el cuadro adjunto. Intente estimar la asignacin de un presupuesto de un billn de euros entre todos los pases miembros para que sea aprobado por unanimidad por el Parlamento, de forma que cada pas miembro reciba el valor de Shapley. (Propuesta de solucin a este ejercicio)

Otros artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn Ejercicios MAXIMN El dilema del prisionero El modelo Halcn-Paloma La guerra de los sexos Juegos con transferencia de utilidad Estrategias reactivasAplicaciones El duopolio en la teora de juegos Las especies en peligroy los recursos naturales La tragedia de los comunes y el origen del derecho El equilibrio de Nash y las polticas macroeconmicasEstrategias reactivasCuando un juego se repite varias veces, cada jugador puede adoptar su estrategia en funcin de las decisiones que haya adoptado antes su oponente. Las estrategias reactivas son las que se adoptan en los juegos con repeticin y se definen en funcin de las decisiones previas de otros jugadores.El ejemplo ms conocido es la estrategia OJO POR OJO (en ingls TIT FOR TAT). Supongamos que dos jugadores repiten de forma indefinida una situacin con pagos de forma delDilema del Prisionero:DILEMA DEL PRISIONEROMATRIZ DE PAGOS

Jugador columna

CooperarTraicionar

JugadorfilaCooperar2,24,1

Traicionar1,43,3*

En esta situacin la estrategia OJO POR OJO puede quedar definida de la forma siguiente: "En la primera jugada elegir la estrategia COOPERAR. En las jugadas siguientes elegir la misma estrategia que haya elegido mi oponente en la jugada anterior". En otras palabras, si el otro coopera, yo cooperar con l. Si el otro es un traidor, yo ser un traidor".La estrategia TIT FOR TAT fue definida y denominada as por el psiclogo experto en teora de juegos Anatol Rapoport, en el marco de los experimentos del politlogo canadiense Robert Axelrod.A comienzos de la dcada de 1980, Robert Axelrod organiz un concurso mundial sobre un dilema del prisionero con repeticin. Los concursantes deban proponer estrategias para obtener la mxima ganancia posible al someterse un nmero indeterminado de veces al Dilema del Prisionero.Algunas estrategias en el concurso consistan en siempre traicionar. Otras en siempre cooperar (ser leal) lo que equivaldra al principio de tica cristiana de "poner la otra mejilla".Otras estrategias se apuntaron a la picarda. En general actuaban con la lealtad, pero de vez en cuando sorprendan traicionando al contrario para obtener ms ganancias. Esta picarda no obtuvo buenos resultados porque era represaliada por estrategias ultravengativas, que jams perdonaban la traicin.La estrategia vencedora absoluta del concurso mundial fue la propuesta por Anatol Rapoport, la ley del talin: ojo por ojo y diente por diente. Axelrod la defini como una estrategia colaboradora, dispuesta siempre a pactar, pero justiciera. Si la otra parte le traicionaba una vez, devolva exactamente la misma medida, otra traicin, pero slo una vez. Era por tanto capaz de perdonar. Generaba confianza, era justiciera, pero no rencorosa y obtena buenos resultados (o no peores) cualquiera que fuese su oponente.

Otra posible estrategia reactiva es la TORITO (tambin llamada "GALLITO" en ingls "BULLY"). Esta estrategia consiste en hacer lo contrario que haga el oponente: "Si el otro jugador es leal en una jugada, yo le traicionar en la siguiente; si el otro jugador me ha traicionado, yo le ser leal a la siguiente oportunidad"."Habis odo que fue dicho a los antiguos: Ojo por ojo y diente por diente. Pero yo os digo: No resistis al malo. Ms bien, a cualquiera que te golpea en la mejilla derecha, vulvele tambin la otra."(Mateo 5: 38-39)

En el ambiente del Dilema del Prisionero, la estrategia OJO POR OJO ofrece muy buenos resultados mientras que la estrategia TORITO proporciona pagos medios muy bajos. En cambio, en el ambiente deljuego Halcn-Palomasucede precisamente lo contrario: TORITO obtiene buenos resultados mientras que OJO POR OJO proporciona pagos medios inferiores.HALCN-PALOMA:MATRIZ DE PAGOS

Jugador columna

CooperarTraicionar

JugadorfilaCooperar2,23,1*

Traicionar1,3*4,4

En la vida real es fcil descubrir situaciones y personas (incluyndonos a nosotros mismos) en las que se muestran comportamientos fcilmente identificables con las estrategias OJO POR OJO o TORITO."No me hago al lao de la geyaAunque vengan degollandoCon los blandos yo soy blandoY soy duro con los durosY ninguno en un apuroMe ha visto andar titubiando"(Jos Hernndez: Martn Fierro, 1872)

En el primer caso son los comportamientos descritos por la Ley del Talin. En el despacho de un abogado, negociador profesional, haba un letrero que deca "Por las buenas soy muy bueno, por las malas soy an mejor". Al fin y al cabo, todos los humanos en alguna ocasin nos hemos comprometido con nosotros mismos a mantener esta estrategia en una situacin difcil en la que un oponente poda elegir entre hacernos dao o respetarnos, y preveamos oportunidades para "devolverle la jugada".El segundo caso tambin es muy frecuente. Se trata de ese tipo de personas o comportamientos que en Latinoamrica llaman "ser un torito" y en Espaa "ser un gallito"; es decir, alguien que se muestra muy agresivo pero al que "se le bajan los humos" si se le responde tambin con agresividad.

Otros artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn Ejercicios MAXIMN El dilema del prisionero El modelo Halcn-Paloma La guerra de los sexos Juegos con transferencia de utilidad Estrategias reactivasAplicaciones El duopolio en la Teora de Juegos Las especies en peligroy los recursos naturales La tragedia de los comunes y el origen del derechoEl duopolio en la Teora de JuegosEn el oligopolio, los resultados que obtiene cada empresa dependen no slo de su decisin sino de las decisiones de las competidoras. El problema para el empresario, por tanto, implica una eleccin estratgica que puede ser analizada con las tcnicas de laTeora de Juegos.Artculos sobre Teora de Juegos incluidos en este CD-ROM o sitio web: Introduccin a la Teora de Juegos La estrategia maximn El dilema del prisionero La guerra de los sexos El duopolio en la teoria de juegos Juegos con transferencia de utilidad Estrategias reactivas

Supongamos que dos empresas, Hipermercados Xauen y Almacenes Yuste, constituyen un duopolio local en el sector de los grandes almacenes. Cuando llega la poca de las tradicionales rebajas de enero, ambas empresas acostumbran a realizar inversiones en publicidad tan altas que suelen implicar la prdida de todo el beneficio. Este ao se han puesto de acuerdo y han decidido no hacer publicidad por lo que cada una, si cumple el acuerdo, puede obtener unos beneficios en la temporada de 50 millones. Sin embargo una de ellas puede preparar en secreto su campaa publicitaria y lanzarla en el ltimo momento con lo que conseguira atraer a todos los consumidores. Sus beneficios en ese caso seran de 75 millones mientras que la empresa competidora perdera 25 millones.Los posibles resultados se pueden ordenar en unaMatriz de Pagoscomo la mostrada en el cuadro de la derecha. Cada almacn tiene que elegir entre dos estrategias: respetar el acuerdo Cooperar o hacer publicidad Traicionar. Los beneficios o prdidas mostrados a la izquierda de cada casilla son los que obtiene Xauen cuando elige la estrategia mostrada a la izquierda y Yuste la mostrada arriba. Los resultados a la derecha en las casillas son los correspondientes para Yuste.COMPETENCIA MEDIANTE PUBLICIDAD:MATRIZ DE PAGOS

Yuste

CooperarTraicionar

XauenCooperar50,50-25,75

Traicionar75,-250,0

DILEMA DE LOS PRESOS:MATRIZ DE PAGOSEl que lo mximo que se puede obtener sea 75 M. o 85 M. no tiene mucha influencia sobre la decisin a adoptar, lo nico que importa en realidad es la forma en que estn ordenados los resultados. Si substituimos el valor concreto de los beneficios por el orden que ocupan en las preferencias de los jugadores, la matriz queda como la mostrada en el cuadro. Las situaciones como las descritas en esta matriz son muy frecuentes en la vida real y reciben el nombre deDilema de los Presos.

Yuste

CooperarTraicionar

XauenCooperar2,24,1

Traicionar1,43,3*

Veamos cul debe ser la decisin a adoptar por esos almacenes. El director de la divisin de estrategia de Xauen pensar: "Si Yuste no hace publicidad, a nosotros lo que ms nos conviene es traicionar el acuerdo, pero si ellos son los primeros en traicionar, a nosotros tambin nos convendr hacerlo. Sea cual sea la estrategia adoptada por nuestros competidores, lo que ms nos conviene es traicionarles".El director de la divisin de estrategia de Yuste har un razonamiento similar. Como consecuencia de ello ambos se traicionarn entre s y obtendrn resultados peores que si hubieran mantenido el acuerdo. La casilla de la matriz de pagos marcada con un asterisco es la nica solucin estable: es unpunto de equilibrio de Nash. Contrariamente a las argumentaciones deAdam Smith, en las situaciones caracterizadas por el Dilema de los Presos si los agentes actan buscando de forma racional su propio inters, una "mano invisible" les conducir a un resultado socialmente indeseable.Supongamos ahora otra situacin ligeramente diferente. Si ambas empresas se enredan en una guerra de precios, haciendo cada vez mayores rebajas, ambas sufrirn importantes prdidas, 25 millones cada una. Han llegado al acuerdo de no hacer rebajas con lo que cada una podr ganar 50 millones. Si una de ellas, incumpliendo el acuerdo, hace en solitario una pequea rebaja, podr obtener un beneficio de 75 millones mientras que la otra perdera muchos clientes quedndose sin beneficios ni prdidas.COMPETENCIA EN PRECIOS:MATRIZ DE PAGOS

Yuste

CooperarTraicionar

XauenCooperar50,500,75

Traicionar75,0-25,-25

HALCN-PALOMA:MATRIZ DE PAGOSSi, como en el caso anterior, substituimos los valores concretos por su orden en la escala de preferencias obtenemos una matriz que es conocida en Teora de Juegos comoGallinaoHalcn-Paloma.

Yuste

CooperarTraicionar

XauenCooperar2,23,1*

Traicionar1,3*4,4

El razonamiento de los estrategas ser ahora diferente: "Si nuestros competidores cooperan, lo que ms nos interesa es traicionarles, pero si ellos nos traicionan ser preferible que nos mostremos cooperativos en vez de enredarnos en una guerra de precios. Hagan lo que hagan ellos, nos interesar hacer lo contrario".En el juego "Gallina" el orden en que acten los jugadores es muy importante. El primero en intervenir decidir Traicionar, forzando al otro a Cooperar y obteniendo as el mejor resultado. La solucin de equilibrio puede ser cualquiera de las dos marcadas con un asterisco en la matriz de pagos, dependiendo de cul haya sido el primer jugador en decidirse. Ambas soluciones sonpuntos de equilibrio de Nash.En casi todos los modelos, sea cual sea la forma de la matriz, elprotocoloo reglas del juego influir mucho en la solucin. Adems del orden de intervencin de los jugadores, habr que tener en cuenta si el juego se realiza una sola vez o si se repite cierto nmero de veces, la informacin de que disponen en cada momento, el nmero de jugadores que intervienen y la posibilidad de formar coaliciones, etc.