tablas de decisiÓn bajo incertidumbre

Upload: yack-garcia

Post on 09-Jul-2015

1.027 views

Category:

Documents


0 download

TRANSCRIPT

TABLAS DE DECISIN BAJO INCERTIDUMBRE En los procesos de decisin bajo incertidumbre, el decisor conoce cules son los posibles estados de la naturaleza, aunque no dispone de informacin alguna sobre cul de ellos ocurrir. No slo es incapaz de predecir el estado real que se presentar, sino que adems no puede cuantificar de ninguna forma esta incertidumbre. En particular, esto excluye el conocimiento de informacin de tipo probabilstico sobre las posibilidades de ocurrencia de cada estado. REGLAS DE DECISIN A continuacin se describen las diferentes reglas de decisin en ambiente de incertidumbre, y que sern sucesivamente aplicadas al ejemplo de construccin del hotel. AXIOMTICA Los criterios descritos anteriormente no son los nicos que pueden utilizarse en ambiente de incertidumbre; muchas otras reglas de decisin son vlidas en este contexto, por lo que parece preciso determinar propiedades que hagan un criterio preferible a otro. Con este propsito vamos a describir los axiomas o principios de racionalidad basados en la propuesta realizada por Milnor en 1954, y que pueden ser considerados propiedades razonables para ser verificadas por toda regla de decisin. Axioma 1: Orden El criterio debe proporcionar una ordenacin total de las alternativas del problema. Esta propiedad es deseable,

pues en caso de no darse existiran alternativas no comparables, siendo preciso un nuevo criterio para dilucidar entre elementos maximales. Axioma 2: Simetra El criterio debe ser simtrico, es decir, independiente del orden fijado a priori en el conjunto de alternativas y del orden en que se definan los estados de la naturaleza. Axioma 3: Linealidad La relacin de orden establecida por el criterio no debe cambiar si los resultados xij son reemplazados por otros yij tales que yij = x ij + con Axioma 4: Dominancia fuerte Si en una tabla de decisin existen dos alternativas ai y ak tales que xij>xkj para todos los estados de la naturaleza ej, entonces el criterio debe asignar valores a las alternativas de modo que T(ai)>T(ak). Axioma 5: Independencia de alternativas irrelevantes El criterio debe ser abierto, es decir, el valor asignado por dicho criterio a una alternativa no debe variar al ser definido en otro conjunto de alternativas que contenga al primero con las mismas valoraciones (el orden entre dos alternativas no cambia por la adicin de una nueva alternativa). Esta propiedad es muy importante, ya que garantiza que al aumentar el conjunto de alternativas, los clculos efectuados con anterioridad siguen siendo vlidos. Axioma 6: Linealidad de columnas

La relacin de orden establecida por el criterio no debe cambiar si se aade una constante a todos las valoraciones correspondientes a un estado de la naturaleza. Axioma 7: Independencia de permutacin de filas Si en una tabla de decisin existen dos alternativas ai y ak tales que el conjunto de valoraciones de la alternativa ak es una permutacin del conjunto de valoraciones correspondiente a la alternativa ai, entonces el criterio debe asignar idntico valor a ambas, es decir, T(ai)=T(ak). Axioma 8: Independencia de duplicacin de columnas El criterio debe ser invariante por extensin, es decir, el orden establecido por el criterio no debe cambiar si se aade una nueva columna (estado de la naturaleza) idntica a alguna columna ya existente. La siguiente tabla resume la compatibilidad de los diferentes criterios analizados con los axiomas anteriores. El carcter S indica que el criterio satisface el correspondiente axioma, mientras que N indica que no lo verifica.Wal Hurwic Savag Laplac d z e e Axioma 1 Axioma 2 Axioma 3 Axioma 4 Axioma 5 S S S S S S S S S S S S S S N S S S S S Orden Simetra Linealidad Dominancia fuerte Independencia de alternativas irrelevantes

Axioma 6 Axioma 7 Axioma 8

N S S

N S S

S N S

S S N

Linealidad de columnas Independencia de permutacin de filas Independencia de duplicacin de columnas

SOFTWARE Desde esta pgina se tiene acceso al cdigo fuente java en el que se han implementado los criterios de decisin bajo incertidumbre descritos con anterioridad. Se requiere la utilizacin de la clase Terminal, empleada habitualmente durante el desarrollo del curso. Incertidumbre.java TablaIncert.java Actualmente se encuentra en desarrollo la interface de entrada de datos y presentacin de resultados mediante Applets, lo que contribuir a mejorar sustancialmente el software desarrollado. CRITERIO DE WALD Bajo la alternativa ai, el peor resultado posible que puede ocurrir tiene una valor para el decisor dado por: El valor si se denomina nivel de seguridad de la alternativa ai y representa la cantidad mnima que el decisor recibir si selecciona tal alternativa. En 1950, Wald sugiere que el decisor debe elegir aquella alternativa que le proporcione el mayor nivel de seguridad posible, por lo que S(ai)=si. As, la regla de decisin de Wald resulta ser:

Este criterio recibe tambin el nombre de criterio maximin, y corresponde a un pensamiento pesimista, pues razona sobre lo peor que le puede ocurrir al decisor cuando elige una alternativa. EJEMPLO Partiendo del ejemplo de construccin del hotel, la siguiente tabla muestra las recompensas obtenidas junto con los niveles de seguridad de las diferentes alternativas:Alternativas Terreno comprado A B AyB Ninguno Estados de la Naturaleza Aeropuerto en A 13 -8 5 0 Aeropuerto en B - 12 11 -1 0 si -12 -8 -1 0

La alternativa ptima segn el criterio de Wald sera no comprar ninguno de los terrenos, pues proporciona el mayor de los niveles de seguridad. CRTICA En ocasiones, el criterio de Wald puede conducir a decisiones poco adecuadas. Por ejemplo, consideremos la siguiente tabla de decisin, en la que se muestran los niveles de seguridad de las diferentes alternativas.Estados de la Naturaleza Alternativa s a1 a2 e1 1000 100 e2 99 100 si 99 100

El criterio de Wald seleccionara la alternativa a2, aunque lo ms razonable parece ser elegir la alternativa a1, ya que en el caso ms favorable proporciona una recompensa mucho mayor, mientras que en el caso ms desfavorable la recompensa es similar. CRITERIO MAXIMAX Bajo la alternativa ai, el mejor resultado posible que puede ocurrir tiene un valor para el decisor dado por: El valor oi se denomina nivel de optimismo de la alternativa ai y representa la recompensa mxima que el decisor recibir si selecciona tal alternativa. El criterio maximax consiste en elegir aquella alternativa que proporcione el mayor nivel de optimismo posible, por lo que S(ai)=oi. Esta regla de decisin puede enunciarse de la siguiente forma:

Este criterio corresponde a un pensamiento optimista, ya que el decisor supone que la naturaleza siempre estar de su parte, por lo que siempre se presentar el estado ms favorable. EJEMPLO Partiendo del ejemplo de construccin del hotel, la siguiente tabla muestra las recompensas obtenidas junto con los niveles de optimismo de las diferentes alternativas:

Estados de la Naturaleza Alternativas Terreno comprado A B AyB Ninguno Aeropuerto en Aeropuerto en A B 13 -8 5 0 - 12 11 -1 0 oi 13 11 5 0

La alternativa ptima segn el criterio maximax sera comprar la parcela en la ubicacin A, pues proporciona el mayor de los niveles de optimismo. CRTICA Al utilizar el criterio maximax las prdidas pueden ser elevadas si no se presenta el estado de la naturaleza adecuado. Adems, en ocasiones puede conducir a decisiones pobres o poco convenientes. Por ejemplo, consideremos la siguiente tabla de decisin, en la que se muestran los niveles de optimismo de las diferentes alternativas.Estados de la Naturaleza Alternativas a1 a2 e1 100 99 e2 -10000 99 oi 100 99

El criterio maximax seleccionara la alternativa a1, aunque lo ms razonable parece ser elegir la alternativa a2, ya que evitara las enormes prdidas de a1 en el caso desfavorable, mientras que en el caso favorable la recompensa sera similar.

CRITERIO DE HURWICZ Se trata de un criterio intermedio entre el criterio de Wald y el criterio maximax. Dado que muy pocas personas son tan extremadamente pesimistas u optimistas como sugieren dichos criterios, Hurwicz (1951) considera que el decisor debe ordenar las alternativas de acuerdo con una media ponderada de los niveles de seguridad y optimismo: donde es un valor especfico elegido por el decisor y aplicable a cualquier problema de decisin abordado por l, por lo que T(ai) = si + (1- o i. As, la regla de decisin de Hurwicz resulta ser:

Los valores de prximos a 0 corresponden a una pensamiento optimista, obtenindose en el caso extremo =0 el criterio maximax. Los valores de prximos a 1 corresponden a una pensamiento pesimista, obtenindose en el caso extremo =1 el criterio de Wald. ELECCIN DE Para la aplicacin de la regla de Hurwicz es preciso determinar el valor de , valor propio de cada decisor. Dado que este valor es aplicable a todos los problemas en que el decisor interviene, puede determinarse en un

problema sencillo, como el que se muestra a continuacin, y ser utilizado en adelante en los restantes problemas que involucren al decisor.Estados de la naturaleza Alternativa s a1 a2 e1 1 e2 0 si 0 oi 1 S(ai) 1-

Si las alternativas a1 y a2 son indiferentes para el decisor, se tendr 1- = , por lo que = 1-. Por tanto, para determinar el decisor debe seleccionar repetidamente una alternativa en esta tabla, modificando el valor de en cada eleccin, hasta que muestre indiferencia entre ambas alternativas. EJEMPLO Partiendo del ejemplo de construccin del hotel, la siguiente tabla muestra las recompensas obtenidas junto con la media ponderada de los niveles de optimismo y pesimismo de las diferentes alternativas para un valor =0.4:Estados de la Alternativa Naturaleza s Terreno Aeropuert Aeropuerto comprado o en A en B A B AyB Ninguno 13 -8 5 0 -12 11 -1 0

si -12 -8 -1 0

oi 13 11 5 0

S(ai) 3 3.4 2.6 0

La alternativa ptima segn el criterio de Hurwicz sera comprar la parcela en la ubicacin B, pues proporciona la mayor de las medias ponderadas para el valor de seleccionado. CRTICA El criterio de Hurwicz puede conducir en ocasiones a decisiones poco razonables, como se muestra en la siguiente tabla:Estados de la naturaleza Alternativa e1 s a1 a2 0 1 e2 1 0...

e50 1 0

si 0 0

oi S(ai) 1 1 1- 1-

... ...

Segn el criterio de Hurwicz ambas alternativas son equivalentes, aunque racionalmente la alternativa a1 es preferible a la alternativa a2. Ms an, si el resultado de la eleccin de la alternativa a2 cuando la naturaleza presenta el estado e1 fuese 1.001, se seleccionara la segunda alternativa, lo cual parece poco razonable. CRITERIO DE SAVAGE En 1951 Savage argumenta que al utilizar los valores xij para realizar la eleccin, el decisor compara el resultado de una alternativa bajo un estado de la naturaleza con todos los dems resultados, independientemente del estado de la naturaleza bajo el que ocurran. Sin embargo, el estado de la naturaleza no es controlable por el decisor, por lo que el resultado de una alternativa slo debera ser comparado con los resultados de las dems alternativas bajo el mismo estado de la naturaleza. Con este propsito Savage define el concepto de prdida relativa o prdida de oportunidad rij asociada a un

resultado xij como la diferencia entre el resultado de la mejor alternativa dado que ej es el verdadero estado de la naturaleza y el resultado de la alternativa ai bajo el estado ej:

As, si el verdadero estado en que se presenta la naturaleza es ej y el decisor elige la alternativa ai que proporciona el mximo resultado xij, entonces no ha dejado de ganar nada, pero si elige otra alternativa cualquiera ar, entonces obtendra como ganancia xrj y dejara de ganar xij-xrj. Savage propone seleccionar la alternativa que proporcione la menor de las mayores prdidas relativas, es decir, si se define ri como la mayor prdida que puede obtenerse al seleccionar la alternativa ai,

el criterio de Savage resulta ser el siguiente:

Conviene destacar que, como paso previo a la aplicacin de este criterio, se debe calcular la matriz de prdidas relativas, formada por los elementos rij. Cada columna de esta matriz se obtiene calculando la diferencia entre el valor mximo de esa columna y cada uno de los valores que aparecen en ella. EJEMPLO

Partiendo del ejemplo de construccin del hotel, la siguiente tabla muestra la matriz de prdidas relativas y el mnimo de stas para cada una de las alternativas.

Alternativa Estados de la Naturaleza s Aeropuerto Aeropuerto Terreno en A en B comprado A B AyB Ninguno 0 21 8 13 23 0 12 11

i 23 21 12 13

El mayor resultado situado en la columna 1 de la tabla de decisin original es 13; al restar a esta cantidad cada uno de los valores de esa columna se obtienen las prdidas relativas bajo el estado de la naturaleza Aeropuerto en A. De la misma forma, el mximo de la columna 2 en la tabla original es 11; restando a esta cantidad cada uno de los valores de esa columna se obtienen los elementos rij correspondientes al estado de la naturaleza Aeropuerto en B. Como puede observarse, el valor i menor se obtiene para la tercera alternativa, por lo que la decisin ptima segn el criterio de Savage sera comprar ambas parcelas. CRTICA El criterio de Savage puede dar lugar en ocasiones a decisiones poco razonables. Para comprobarlo, consideremos la siguiente tabla de resultados:Estados de la Naturaleza

Alternativa s a1 a2

e1 9 4

e2 2 6

La tabla de prdidas relativas correspondiente a esta tabla de resultados es la siguiente:Estados de la Naturaleza Alternativa s a1 a2 e1 0 5 e2 4 0 i 4 5

La alternativa ptima es a1. Supongamos ahora que se aade una alternativa, dando lugar a la siguiente tabla de resultados:Estados de la Naturaleza Alternativa s a1 a2 a3 e1 9 4 3 e2 2 6 9

La nueva tabla de prdidas relativas sera:Estados de la Naturaleza Alternativa s a1 a2 a3 e1 0 5 6 e2 7 3 0 i 7 5 6

El criterio de Savage selecciona ahora como alternativa ptima a2, cuando antes seleccion a1. Este cambio de alternativa resulta un poco paradjico: supongamos que a una persona se le da a elegir entre peras y manzanas, y prefiere peras. Si posteriormente se la da a elegir entre peras, manzanas y naranjas, esto equivaldra a decir que ahora prefiere manzanas! CRITERIO DE LAPLACE Este criterio, propuesto por Laplace en 1825, est basado en el principio de razn insuficiente: como a priori no existe ninguna razn para suponer que un estado se puede presentar antes que los dems, podemos considerar que todos los estados tienen la misma probabilidad de ocurrencia, es decir, la ausencia de conocimiento sobre el estado de la naturaleza equivale a afirmar que todos los estados son equiprobables. As, para un problema de decisin con n posibles estados de la naturaleza, asignaramos probabilidad 1/n a cada uno de ellos. Una vez realizada esta asignacin de probabilidades, a la alternativa ai le corresponder un resultado esperado igual a:

La regla de Laplace selecciona como alternativa ptima aquella que proporciona un mayor resultado esperado:

EJEMPLO

Partiendo del ejemplo de construccin del hotel, la siguiente tabla muestra los resultados esperados para cada una de las alternativas.

Alternativa s Resultad Aeropuerto Aeropuerto Terreno o en A en B comprado esperado A B AyB Ninguno 13 -8 5 0 -12 11 -1 0 0.5 1.5 2 0

Estados de la Naturaleza

En este caso, cada estado de la naturaleza tendra probabilidad ocurrencia 1/2. El resultado esperado mximo se obtiene para la tercera alternativa, por lo que la decisin ptima segn el criterio de Laplace sera comprar ambas parcelas. CRTICA La objecin que se suele hacer al criterio de Laplace es la siguiente: ante una misma realidad, pueden tenerse distintas probabilidades, segn los casos que se consideren. Por ejemplo, una partcula puede moverse o no moverse, por lo que la probabilidad de no moverse es 1/2. En cambio, tambin puede considerarse de la siguiente forma: una partcula puede moverse a la derecha, moverse a la izquierda o no moverse, por lo que la probabilidad de no moverse es 1/3.

Desde un punto de vista prctico, la dificultad de aplicacin de este criterio reside en la necesidad de elaboracin de una lista exhaustiva y mutuamente excluyente de todos los posibles estados de la naturaleza. Por otra parte, al ser un criterio basado en el concepto de valor esperado, su funcionamiento debe ser correcto tras sucesivas repeticiones del proceso de toma de decisiones. Sin embargo, en aquellos casos en que la eleccin slo va a realizarse una vez, puede conducir a decisiones poco acertadas si la distribucin de resultados presenta una gran dispersin, como se muestra en la siguiente tabla:Estados de la Naturaleza Alternativa s a1 a2 e1 15000 5000 e2 -5000 4000 Resultad o esperado 5000 4500

Este criterio seleccionara la alternativa a1, que puede ser poco conveniente si la toma de decisiones se realiza una nica vez, ya que podra conducirnos a una prdida elevada. Ejercicios Propuestos y resueltos 3.1. Supongamos una empresa lctea que quiere conocer el nmero de litros de leche (Q) que debera vender al mes para hacer mximo su beneficio. Conoce sus funciones de ingresos y costes, que ha sido estimadas de la siguiente forma: Ingreso total: It = 100 Q 0,005 Q2 Coste total: Ct = 0,008 Q 2 + 50 Q + 250.000

Calcular su mximo beneficio. 3.2. Un agricultor puede analizar sus diferentes estrategias de cultivo en funcin del terreno y clima, seleccionando como ms adecuados el trigo, la patata y la remolacha. Los estados de la naturaleza pueden ser sintetizados en ao lluvioso, normal y seco. En el momento de tomar la decisin el empresario agrcola no conoce cmo va a ser el ao, sin embargo, puede tener una aproximacin de tipo intuitivo o por predicciones a largo plazo que le permita cuantificar las probabilidades asociadas: 30% lluvioso, 50% normal, 20% seco. Adems, sus conocimientos agrcolas le permiten estimar cules sern las cosechas de cada uno de los productos en las tres alternativas climatolgicas, as como los precios esperados. Puede, en consecuencia, realizar las estimaciones de los desenlaces. La matriz de decisin donde se recoge toda la informacin quedara:Estados de la . naturaleza Probabilidad Trigo Estrategias Patatas Remolach a Lluvioso 0,30 250 150 -100 Normal 0,50 290 200 450 Seco 0,20 200 250 350

Dnde cada desenlace recoge el beneficio estimado si se adopta la estrategia i y se presenta el estado de la naturaleza j. Qu eleccin debera tomar? Calculamos el valor esperado para cada estrategia: VE(Trigo) = 250 * 0,3 + 290 * 0,5 + 200 * 0,2 = 260 VE(Patatas) = 150 * 0,3 + 200 * 0,5 + 250 * 0,2 = 195 VE(Remolacha) = -100 * 0,3 + 400 * 0,5 + 350 * 0,2 = 265

La eleccin sera cultivar remolacha que es el producto que proporciona mayores beneficios. Pero si se cultiva remolacha y el tiempo es lluvioso, tendramos un resultado negativo, lo que podra llevar al agricultor a cultivar trigo que ofreciendo un valor esperado menor no tiene posibilidades de resultados negativos.

3.3. La empresa Completo, S.A. est analizando la estrategia ptima a emprender para el prximo ejercicio. Despus de analizar detalladamente sus distintas posibilidades llega a la conclusin que, bsicamente, puede emprender cuatro estrategias: diversificacin, expansin, diferenciacin y especializacin. Aunque las condiciones del entorno son dificiles de prever, estudios de mercado predicen cinco posibles estados de la naturaleza: demanda alta, media alta, media, media baja y baja; con unas probabilidades aproximadas del 10%, 20%, 30%, 30% y 10%, respectivamente. Si los posibles desenlaces resultantes de la combinacin de las estrategias y de los estados de la naturaleza se recogen en la siguiente matriz:DEMANDA Diversificaci n Expansin Diferenciaci n Especializaci n Alt Media Medi Media Baj a -Alta a -Baja a 60 30 20 50 40 40 35 30 50 20 15 80 70 25 10 40 35 15 60 70

Determinar la decisin ptima a tomar en base a los siguientes criterios: a) Laplace b) Optimista c) Pesimista o de Wald d) Hurwicz e) Savage

3.4. Supongamos la siguiente matriz de pagos de un juego bipersonal de suma ceroA1 A2 A3 B1 -2 1 3 B2 5 3 -7 B3 -3 5 11

Que estrategia seguir cada uno de los competidores? 3.5. Mariachi Productions es una productora de series de televisin. Acaba de firmar un contrato para producir un nuevo espectculo de primera lnea "Ya te lo dije, mi amol". El presidente de la empresa le ha pedido a Vd. que determine una inversin inicial apropiada para el programa piloto de 2 horas y para los siguientes ocho episodios de una hora de la serie. La Junta Directiva divide las inversiones para programas en tres niveles generales, que despus se convierten en las alternativas de decisin: 1. Nivel Inferior: Ninguno de los actores tiene un reconocimiento sustantivo. 2. Nivel Moderado: El actor principal tiene reconocimiento, pero no as el resto de actores de apoyo. 3. Nivel Alto: Ms de uno de los actores tiene reconocimiento. Las implicaciones financieras de estas decisiones dependen del xito futuro de la serie. Las investigaciones de mercado realizadas determinan las siguientes posibilidades: 1. Fracaso: Menos del 10% de los espectadores ven el programa. 2. xito: Entre el 10% y el 20% de los espectadores ven el programa.

3. Gran xito: Ms del 20% de los espectadores ven el programa. Su trabajo consiste en evaluar cada alternativa de inversin sobre la base de los beneficios. Dichos beneficios no slo estn basados en la inversin inicial, sino tambin en le xito resultante del programa. Para el problema de Mariachi Productions, estos beneficios dependern de la decisin que se tome y el xito que consiga el programa. El sentido comn le dice que cuanto ms grande sea el nivel de compromiso , mayor ser la cantidad que puede perder el estudio. Si Vd. decide invertir en el nivel alto y el espectculo es un fracaso, el estudio perder mucho. Esto es as porque un nivel bajo de espectadores redundar en un nivel ms bajo de entradas por publicidad de los patrocinadores y, al mismo tiempo, los costes de produccin, el salario de los actores y otros gastos todava tendrn que hacerse. En el otro extremo si Vd. decide invertir a un nivel bajo y el espectculo resulta ser un gran xito, esto permitir al estudio cobrar mayores tarifas por la publicidad. En este caso, el estudio puede esperar que le vaya muy bien debido a que la inversin inicial es baja y las entradas por publicidad sern altas. Recabando toda la informacin las estimaciones de beneficios (en millones de pesetas) para cada decisin resultado son las siguientes:RESULTADOS GRAN DECISIONE FRACASO XIT XIT S S O O Baja -2 5 8 Moderada -5 10 12 Alta -8 6 15

Qu decisin recomendara Vd.?

Soluciones de Ejercicios Propuestos 3.1. La funcin del beneficio sera: B = It - Ct = (100 Q - 0,005 Q2) - (0,008 Q 2 + 50 Q + 250.000) = - 0,003 Q2 + 50 Q - 250.000 Para obtener el volumen de ventas Q que hace mximo el beneficio, calculamos la primera derivada respecto a Q: dB / dQ = - 0,006 Q + 50 E igualando a cero, obtendremos el valor ptimo de Q: - 0,006 Q + 50 = 0 Q = 50 / 0,006 = 8.333,33 El mximo beneficio lo obtendra fabricando y vendiendo 8.334 litros de leche. 3.2. Calculamos el valor esperado para cada estrategia: VE(Trigo) = 250*0,3 + 290*0,5 + 200*0,2 = 260 VE(Patatas) = 150*0,3 + 200*0,5 + 250*0,2 = 195 VE(Remolacha) = -100*0,3 + 400*0,5 + 350*0,2 = 265 La eleccin sera cultivar remolacha que es el producto que proporciona mayores beneficios. Pero, si se cultiva remolacha y el tiempo es lluvioso, tendramos un resultado negativo, lo que podra llevar al agricultor a cultivar trigo que ofreciendo un valor esperado menor no tiene posibilidades de resultados negativos.

3.3. a) El criterio de Laplace intenta convertir la incertidumbre en riesgo. Si no conocisemos las probabilidades de los estados de la naturaleza , asignaramos la misma probabilidad a todos ellos, en este caso 0,2 (20%) Calculamos el VE de cada estrategia con estas probabilidades: VE(DIV) = (60+40+50+70+35)*0.20= 51 VE(EXP) = (30+40+20+25+15)*0.20 = 26 VE(DIF) = (20+35+15+10+60)*0.20 = 28 VE(ESP) = (50+30+80+40+70)*0.20 = 54 Elegiramos aquella estrategia que tenga el mayor valor esperado.: Especializacin b) El criterio optimista nos dice que se elegira aquella estrategia que nos de la mxima ganancia de los mximos beneficios (MAXIMAX) DIV= 70 EXP = 40 DIF= 60 ESP = 80 Para la estrategia de diversificacin el mximo beneficio se obtiene si la demanda es media baja. Para la estrategia de expansin se produce cuando la demanda es media alta. Para la estrategia de diferenciacin se produce cuando la demanda es baja. Y para la estrategia de especializacin se produce cuando la demanda es baja. Escogeremos aquella estrategia que nos aporte mayores ganancias: Especializacin

c) Segn el criterio pesimista o de Wald elegimos aquella estrategia que nos de la mxima ganancia de los mnimos beneficios (MAXIMIN). DIV= 35 EXP = 15 DIF= 10 ESP = 30 Para la estrategia de diversificacin los mnimos beneficios se producen cuando la demanda es baja. Para la estrategia de expansin se produce cuando la demanda es baja. Para la estrategia de diferenciacin se produce con demanda media baja. Para la estrategia de especializacin se produce cuando la demanda es media alta. Escogemos aquella estrategia que aporta la mayor ganancia: Diversificacin d) El criterio de Hurwicz combina optimismo y pesimismo. a Probabilidad optimista. Por ejemplo: 70% b=(1-a) Probabilidad pesimista. (10,7)=30% El problema que plantea este criterio es que depende de la actitud del decisor (subjetividad). Para aplicar este criterio debemos calcular el valor esperado para cada estrategia pero tomando el mejor desenlace y aplicandole la probabilidad optimista ms el peor desenlace por la probabilidad pesimista. DIV: 70*0.70 + 35*0.30 = 59.5 EXP: 40*0.70 + 15*0.30 = 32.5 DIF: 60*0.70 + 10*0.30 = 45 ESP: 80*0.70 + 30*0.30 = 65

Escogemos aquella alternativa que tenga el mayor valor: Especializacin Si a= 1 es igual que el criterio optimista Si a= 0 es igual que el criterio pesimista e) El criterio de Savage propone la utilizacin de una matriz de arrepentimiento, formada por los costes de opotunidad. Si la demanda es alta lo mejor que podra haber hecho es diversificarme, el coste de oportunidad es cero si me diversifico, de expansin es 30 (60-30) que es lo que dejo de ganar, de diferenciarme 40 (60-20) y de especializarme 10(60-50). Si la demanda es de otro tipo el mecanismo que se aplica es el mismo para construir la matriz de arrepentimiento.DEMANDA Diversificaci n Expansin Diferenciaci n Especializaci n Alt Media Medi Media Baj a -Alta a -Baja a 0 30 40 10 0 0 5 10 30 60 65 0 0 45 60 30 35 55 10 0

Sobre la matriz de arrepentimiento aplicamos el criterio pesimista: dejar de ganar el mnimo de lo mximo que podra dejar de ganar (MINIMAX) DIV= 35 EXP = 60 DIF= 65 ESP = 30 Elegiramos el menor: Especializacin. Tambin podra aplicarse el criterio optimista (MINIMIN).

3.4. Lo primero que debemos observar es si existen dominancias. Es decir, si existe alguna estrategia dominada. Entre A1 y A2 no domina ninguna. Entre A1 y A3 no domina ninguna. Entre A2 y A3 no domina ninguna. Entre B1 y B2 no domina ninguna. Entre B1 y B3 no domina ninguna. Entre B2 y B3 no domina ninguna. No puedo descartar ninguna estrategia, me interesa jugar dependiendo de lo que juegue el contrario. Utilizamos criterios pesimistas, ya que al igual que el jugador A tiene informacin de B, el jugador B la tiene de A. Para el jugador A la estrategia es MAXIMIN: - Si A juega A1 lo peor es que B juegue B3 y el desenlace sera -3 - Si A juega A2 lo peor es que B juegue B1 y el desenlace sera 1 - Si A juega A3 lo peor es que B juegue B2 y el desenlace sera -7 Elegira la estrategia A2 Para el jugador B la estrategia es MINIMAX: - Si B juega B1 lo peor es que A juegue A2 y el desenlace sera 1 - Si B juega B2 lo peor es que A juegue A1 y el desenlace sera -5 - Si B juega B3 lo peor es que A juegue A3 y el desenlace sera 11 Elegira la estrategia B1

Existe "punto de silla", que coincide con el valor del juego si la estrategia MAXIMIN para el jugador A es igual a la estrategia MINIMAX para el jugador B: MAXIMIN (A) = MINIMX(B) 1 = 1 V=1 Si A juega A2 gana como mnimo 1 unidad y B se conforma con perder como mximo 1 unidad. Si A pone un espa en B el resultado no vara, se sigue con la misma estrategia. Lo mismo sucede si lo hace B. Es decir, cuando hay estrategias puras, establecer espas no vara la toma de decisin de la estrategia. 3.5. La eleccin de la mejor alternativa de decisin, es decir, de inversin (inferior, moderada o alta) depende del criterio que tome Mariachi Productions. Depndendiendo del criterio elegido, se puede llegar una decisin diferente. Si se utiliza el CRITERIO OPTIMISTA O MAXIMAX, se escogera la alternativa que tenga el potencial del mximo beneficio posible. Se identifica la mxima ganancia para cada una de las alternativas de inversin: Baja: 8 Moderada: 12 Alta: 15 De estas alternativas, la que podra generar el mayor beneficio es inversin alta, con un beneficio mximo posible de 15 millones. Si Vd. Opta por elegir este criterio tenga en cuenta el alto grado de riesgo que conlleva la eleccin optimista: en el caso de que el espectculo fuera

un fracaso perdera 8 millones. Para tener en cuenta la posibilidad de prdida puede utilizar otro criterio ms conservador. Con el CRITERIO PESIMISTA O MAXIMIN se seleccionar la alternativa que maximice el beneficio mnimo posible. Para ello se identifica el peor beneficio posible para cada alternativa: Baja: -2 Moderada: -5 Alta: -8 La alternativa que maximiza esta mnima ganancia es una inversin Baja, que lleva a una prdida de 2 millones y asegura la mnima prdida posible. Se pueden utilizar otros criterios que combinan situaciones intermedias entre el criterio optimista y el criterio pesimista. El CRITERIO DE HURWICZ combina los dos criterios anteriores decidiendo lo optimista o pesimista que se quiere ser de la siguiente forma: - Elija un coeficiente de optimismo que tiene un valor entre 0 y 1 - Calcule para cada alternativa: Ganancia ponderada = * beneficio mximo + (1-) * beneficio mnimo Supongamos =0.7, entonces: Ganancia ponderada (baja) = 0.7*8+0.3*(-2) =5 Ganancia ponderada (moderada) = 0.7*12+0.3*(-5) = 6.9 Ganancia ponderada (alta) =0.7*15+0.3*(-8) =8.1 En este caso se escogera la inversin alta. Si aplicamos el CRITERIO DE SAVAGE O MINIMAX se elegir aquella alternativa que minimice los costes de oportunidad por no haber escogido en cada caso la

mejor decisin, basado en el resultado. Para cada resultado, identifique la decisin ptima que se pudo haber tomado. Cualquier otra alternativa, tiene como resultado un arrepentimiento o coste de oportunidad porque no fue la mejor alternativa. Este coste de oportunidad se puede cuantificar por la diferencia entre el beneficio por la mejor decisin y el beneficio por la decisin no ptima. Por tanto, habr que construir una matriz de arrepentimiento o de costes de oportunidad:RESULTADOS GRAN DECISIONE FRACASO XIT XIT S S O O Baja 0 5 7 Moderada 3 0 3 Alta 6 4 0

De ella, se calcula el mximo arrepentimiento para cada alternativa: Baja: 7 Moderada: 3 Alta: 6 Se selecciona aquella alternativa que tenga el menor de los mximos arrepentimientos: Moderada. Al seleccionar la inversin moderada, independientemente de cul sea el resultado, el estudio, en el peor de los casos ganar 3 millones menos del beneficio que hubiera obtenido si hubiera sabido el resultado final. En resumen, el criterio que se elija determinar la seleccin de la decisin: Criterio optimista : Inversin alta Criterio pesimista : Inversin baja

Criterio de Hurwicz :Inversin alta Criterio de Savage : Inversin moderada

Cmo se hacen los ejercicios de los criterios Criterio de esperanza matemtica o de riesgo: Este criterio dice que cada posible decisin tiene un % de probabilidad diferente de ser la mejor opcin. 1) Encima de cada columna del cuadro, se indica su %. 2) A parte, se representa con E y un nmero a partir del 1. Habr tantas como posibles acciones (filas). Por filas, se multiplica cada n de la tabla por el % de probabilidad indicado en su columna. Se suman los resultados de cada fila por separado. 2) Comparando los diferentes resultados, gana el ms alto. Criterio de Laplace: Este criterio dice que todas las posibles decisiones a tomar tienen la misma probabilidad de ser la mejor. Por tanto, no existe % de probabilidad. 1) Se representa con L y un nmero a partir del 1. Habr tantas como posibles acciones (filas). Por filas, se suman los n y se multiplican por 1 (uno) dividido por el n de columnas que haya. 2) Comparando los diferentes resultados, gana el ms alto. Criterio de Wald o pesimista: Este criterio dice que dice que sea cual sea la decisin que se tome, las variables incontrolables (o estados de la naturaleza) harn que el resultado sea desfavorable para la empresa. 1) Se representa con W y un nmero a partir del 1. Habr tantos como posibles acciones (filas). Se indica el peor

resultado (el ms bajo) de cada fila (teniendo en cuenta que, por ejemplo, el 0 es mayor que un n negativo). 2) Se busca el Maximn (mximo entre los mnimos) que es el n ms alto entre los anteriores. Criterio optimista: Este criterio dice que las variables incontrolables (o estados de la naturaleza) siempre beneficiarn a la empresa. 1) Se representa con O y un nmero a partir del 1. Habr tantos como posibles acciones (filas). Se indica el mejor resultado (el ms alto) de cada fila (teniendo en cuenta que, por ejemplo, el 0 es mayor que un n negativo). 2) Se busca el Maximax (mximo entre los mximos) que es el n ms alto entre los anteriores. Criterio Hurwicz u optimismo parcial: Este criterio dice que el optimismo es en 1 grado igual al pesimismo, es decir, que 1 - optimismo = pesimismo, y viceversa. max (a * Ri + (1-a) * r i) a = % optimismo Ri = mejor resultado 1-a = % pesimismo r i = peor resultado 1) Se representa con H y un nmero a partir del 1. Habr tantos como posibles acciones (filas). Se aplica esa frmula (multiplicando el % de optimismo * n ms alto de su fila) + (% optimismo * n ms bajo de su fila). 2) Comparando los diferentes resultados, gana el ms alto. Criterio Savage o coste de oportunidad:

Este criterio dice que para cada estado de la naturaleza (variable incontrolable) hay una decisin que es mejor que el resto. Hay que buscar qu se deja de ganar o qu se pierde si se toma otra decisin que no sea sa (es decir, que permite el arrepentimiento). 1) Encima de cada columna del cuadro, se indica el n ms alto de su columna. 2) Dentro de la tabla, se va restando ese n ms alto de cada n de la tabla. 3) A parte, se representa con S y un nmero a partir del 1. Habr tantos como posibles acciones (filas). Se busca el Minimax (mnimo entre los mximos) que es el n ms alto de cada fila (teniendo en cuenta que, por ejemplo, el 0 es mayor que un n negativo).

PRINCIPIO de HURWICZ Este criterio de toma de decisiones parte de establecer un coeficiente de pesimismo , entre 0 y 1, y queda, a su vez, fijado (1- ). Para decidir se multiplica el mximo valor de cada estrategia por (1- ) y tambin el mnimo valor por el coeficiente de pesimismo , sumando los resultados para cada estrategia. Se elige finalmente la estrategia que conlleve un mayor valor. As podemos decir que este criterio distingue los resultados mximos y mnimos posibles de cada alternativa; hecho esto aplica el factor de ponderacin a llamado "ndice de optimismo relativo", para llegar a la decisin mediante el clculo de utilidades esperadas. El criterio se aplica siguiendo la siguiente secuencia: 1.- De la matriz de decisiones se seleccionan el mejor y el peor valor para cada alternativa, dando lugar a un vector de ptimos y a otro de psimos. 2.- El vector de ptimos se afecta por el ndice a y el vector de psimos por (1 - a). El ndice a varia entre 0 y 1; a = 0 para el caso ms pesimista ( criterio minimin ) a = 1 para el caso ms optimista ( criterio maximax ) 0 < a < 1 para los casos intermedios. 3.- La suma de los vectores ( de ptimos y psimos ) ya ponderados, es el vector de valores esperados. La alternativa seleccionada es aquella que corresponde al mximo valor esperado.

Criterios de Decisin en situaciones de incertidumbre. Cuatro ejemplos La distincin entre riesgo e incertidumbre fue establecida por F. Knight en 1921, quien en su obra Risk, Uncertainty and Profit se refera a la primera como aquella situacin en la que no existe certeza sobre el resultado de la decisin, aunque se conoce al menos la probabilidad de los distintos resultados alternativos. Este sera el caso, por ejemplo, de la eleccin entre cara o cruz de una moneda: desconocemos de antemano el resultado (si la moneda no est trucada, claro est) pero conocemos la probabilidad objetiva de las dos alternativas. Las situaciones de incertidumbre se caracterizaran, en cambio, por el hecho de que no slo desconocemos el resultado final, sino que no podemos predecirlo tampoco en trminos de probabilidades objetivas. As pues, uno de los problemas centrales a los que se ha enfrentado la teora de la decisin ha consistido en establecer algn criterio (o criterios) que nos permita optar por una accin u otra en situaciones de incertidumbre. Algunos de los criterios ms conocidos se exponen a continuacin (7). 1. Criterio maximn. Supongamos que hemos de decidir si hacemos A o B, cuyas consecuencias son C, D y E, como queda reflejado en la matriz de pagos o resultados que presentamos ms abajo. Si optamos por A podemos obtener el resultado ms

favorable (100), pero tenemos tambin dos resultados muy malos (2 y 1). Si elegimos B corremos el riesgo de no ganar nada, si bien C y D no ofrecen ambas un buen resultado. Cmo decidiremos qu hacer si no podemos atribuir objetivamente ninguna probabilidad a las consecuencias de nuestra accin?Acciones A B Resultados posibles C 100 99 D 2 98 E 1 0

Si conociramos la probabilidad de cada uno de los sucesos elegiramos sin ms el que nos beneficiara con mayor seguridad. Pero como no es as, como desconocemos las probabilidades de los sucesos, lo que el criterio maximn nos aconseja es seguir aquella accin que nos asegure el mximo de los mnimos; esto es, la accin que nos libre del peor resultado posible. En esta ocasin sera la accin A la que el maximn recomendara seguir pues, en el peor de los casos, obtendramos como mnimo 1, es decir, un resultado mejor que el peor de los resultados de la accin B. El criterio maximn compara entre s los peores resultados de cada una de las opciones posibles y elige el mejor de ellos (el mximo de los mnimos). Se trata, pues, de un criterio esencialmente conservador ?slo busca que no salgamos muy mal parados? que desperdicia buena parte de la informacin que nos procura la matriz de pagos, pues solamente tiene en cuenta los peores resultados de cada fila (8). 2. Criterio maxmax.

Este criterio, a diferencia del anterior, slo tiene en cuenta el mejor resultado posible de cada accin (el mximo de los mximos). En el ejemplo anterior, de nuevo la accin A saldra favorecida, pues el mejor resultado posible es 100. Aunque no es una estrategia que busque precisamente evitar el riesgo a toda costa ?ms bien lo contrario? adolece del mismo defecto que el criterio maximn: no tiene en cuenta la mayor parte de la informacin que nos ofrece la situacin de eleccin. 3. Criterio a de Hurwicz. Para evitar el conservadurismo del maximn y el optimismo del maximax, Hurwicz propuso un criterio que equivale a la suma ponderada de los resultados extremos de ambas lneas de accin. Puesto que nadie es siempre optimista o siempre pesimista, el criterio de Hurwicz establece una va intermedia entre el maximn y el maximax. As, por ejemplo, si alguien otorga a los peores resultados de A y B un valor a = 3/4, y de 1/4 (es decir, 1-a) a los mejores resultados, el criterio de Hurwicz valorar las distintas lneas de accin de la siguiente manera: A = 1 X 3/4 + 100 X 1/4 = 18,75 B = O X 3/4 + 99 X 1/4 = 18 De nuevo sale elegida la accin A en nuestro ejemplo. La eleccin del valor de a determina, pues, el grado de pesimismo u optimismo del decisor: si a fuera igual a 1, el criterio de Hurwicz sera idntico al maximn; si fuera igual a O sera idntico al maximax. En cualquier caso, distintos decisores darn valor distinto a A por motivos puramente subjetivos. As pues, si bien este criterio no excluye tanta

informacin como los dos anteriores, tampoco la tiene toda en cuenta, pues excluye los valores intermedios.

4. Criterio de razn insuficiente de Laplace. El criterio de Laplace s considera, en cambio, todos los valores. Puesto que no tenemos informacin sobre la probabilidad de que ocurra C, D o E, lo ms racional sera, segn este criterio, asignarle a cada valor la misma probabilidad y elegir el que nos d el mayor valor esperado (la mayor utilidad esperada). De esta forma obtendramos los siguientes resultados para A y B: A = 1/3 X 100 + 1/3 X 2 + 1/3 X 1 = 34^3 B = 1/3 X 99 + 1/3 x 98 + 1/3 X O = 65^3 A diferencia de los que ocurre con los dems criterios, ste es el nico que sita la accin B por encima de A. Ello se debe sin duda al hecho de que se tomen en consideracin todos los valores (9). Como vemos, pues, no slo es evidente que no existe un nico criterio recomendable para tomar decisiones en situaciones inciertas, sino que, excepto el de Laplace, todos apelan a la subjetividad de quien decide: a su optimismo o pesimismo con respecto a la situacin de eleccin. ???????. (7) Para lo que sigue nos basamos en Baumol (1977: 460463). Una informacin ms detallada sobre estos y otros criterios se encontrar en Luce y Raiffa (1957, cap. 13) y en French (1986, cap. 2). Una interesante aplicacin prctica de esos criterios se encontrar en Caas y de Haro (1982).

(8) Un ejemplo ilustre de cmo se puede usar este criterio lo encontramos en la teora de la justicia de John Rawls. A su modo de ver, los principios de justicia que elegira un individuo racional en una situacin de incertidumbre (la posicin original precontractual) seran la solucin maximn al problema de la justicia social (Rawls, 1971: 152). Una crtica de la naturaleza conservadora de este criterio ?por su excesiva aversin al riesgo- y de la utilidad de su uso en teora moral y poltica se puede hallar en Harsanyi (1975). (9) Como hemos dicho, segn John Harsanyi no es el criterio maximn el que habra que usar en una situacin de incertidumbre ?una posicin original en la que desconocemos quines somos y que servir para sellar un contrato social hipottico- para justificar la eleccin de nuestros principios de justicia distributiva, sino que habra que emplear el criterio de razn insuficiente o de equiprobabilidad de Laplace. De esta forma, afirma Harsanyi, un individuo racional ser utilitarista, pese a lo que asegura Rawls, pues tratar de elegir principios de justicia que maximicen su utilidad esperada (Harsanyi, 1958,1976).