UNIDAD 2: TEORÍA DE DECISIONES Y JUEGOS

 

 

El proceso de toma de decisiones racional. El método científico. Modelo de Simón para la toma de decisiones. Métodos cuantitativos.

Modelos de toma de decisiones: bajo certidumbre, riesgo, incertidumbre y conflicto.

Decisiones con riesgo. Árbol de decisión. Decisiones bajo incertidumbre. Teoría de juegos.

 

Bibliografía


  1. Investigación de operaciones - Taha, Hamdy - Ed. Alfaomega - 1991 - 2ª edición
  2. Toma de decisiones por medio de investigación de operaciones - Thierauf, Robert - Limusa Noriega Editores - 1993
  3. Investigación de operaciones en la ciencia administrativa - Gould, Eppen, Schmidt - Prentice Hall - 1992 - 3ª edición y posteriores


Introducción y resumen

 

Es una tarea desafiante comparar varios cursos de acción y finalmente seleccionar la acción que se va a realizar. En determinados casos, esta tarea puede resultar excesivamente desafiante. Las dificultades de la toma de decisiones están representadas por la complejidad de las alternativas de decisión. La capacidad que tiene un decisor de procesar información limitada es un factor de exigencia ya cuando se consideran las implicancias de un solo curso de acción, pero en muchas decisiones se deben visualizar y comparar las implicancias de varios cursos de acción. Además, hay factores desconocidos que se inmiscuyen en la situación problemática; rara vez se conoce con certeza el resultado. La mayoría de las veces, el resultado depende de las reacciones de otras personas que quizás ni siquiera saben qué van a hacer. No es de sorprender entonces que a veces los decisores pospongan la elección lo más posible y que luego decidan sin intentar considerar todas las implicancias de su decisión.

 

La toma de una decisión, fundamentalmente, tiene que ver con combinar información sobre probabilidades con información sobre deseos e intereses. ¿Cuántas ganas tienes de salir con esa mujer? ¿Cuán importante es la salida? ¿Cuánto vale ese premio?

 

Abordar las decisiones como si fueran apuestas es la base de la teoría de la decisión. Significa que tenemos que compensar el valor de un cierto resultado contra su probabilidad.

 

Para operar según los cánones de la teoría de la decisión debemos hacer cálculos del valor de un cierto resultado y sus probabilidades, y a partir de allí de las consecuencias de nuestras elecciones.

 

El origen de la teoría de la decisión para la toma de decisiones se deriva de la economía, en el área de la función de la utilidad del pago. Propone que las decisiones deben tomarse calculando la utilidad y la probabilidad de rangos de opciones, y establece estrategias para una buena toma de decisiones. La teoría de la decisión no describe lo que las personas hacen en realidad, porque pueden surgir dificultades con los cálculos de la probabilidad y la utilidad de los resultados. Además, las decisiones pueden verse afectadas por la racionalidad subjetiva de las personas y por la manera en que cada persona percibe cada problema de decisión. Por ejemplo, algunas personas tienen la tendencia a evitar el riesgo cuando hay perspectivas de ganancia, y buscan el riesgo cuando las perspectivas son de pérdida.

 

Los objetivos son importantes, tanto para identificar los problemas como para evaluar las soluciones alternativas. En la evaluación de alternativas, los objetivos del decisor deben expresarse como criterios que reflejen los atributos de las alternativas relevantes para la elección.

 

El estudio sistemático de la toma de decisiones proporciona el marco para escoger cursos de acción en situaciones complejas, inciertas o dominadas por conflictos. La elección entre acciones posibles y la predicción de resultados esperados resultan del análisis lógico que se haga de la situación de decisión

 

Las visiones personal y pública de la racionalidad

 

Los modelos explicitan los objetos, las relaciones y las propiedades en cada situación determinada, y sirven para la inferencia y la decisión. Cuando un problema no puede resolverse sólo con esta información, el conjunto de modelos debe "engordarse" para que pueda construirse una nueva búsqueda de un modelo posible. La mayoría de las personas recurren a sus creencias para alcanzar sus metas, pero sin visión racional. Todos debatimos qué es el pensamiento racional. Se dice que del pensamiento racional emanan tres cuestiones esenciales:

1.       si se puede decir que alguna vez una persona cometió un error de razonamiento,

2.       si algunos problemas deductivos están más allá de la capacidad de razonadores no entrenados en lógica, y

3.       si la racionalidad es relativa a la cultura.

 

La teoría del conocimiento aborda los siguientes temas:

 

·         qué es lo que la mente calcula,

·         cómo lo hace, y

·         qué hacen las personas realmente al razonar y pensar.

 

Todavía son preguntas sin respuestas definitivas. Por ejemplo, con respecto al último tema, la teoría del conocimiento no intenta probar si una inferencia es válida o si una regla es verdadera o falsa, sino que, por el contrario, busca la información más útil para actualizar las creencias. Lo que cuenta como información útil se resuelve como una estrategia racional. El análisis racional se basa en la presunción de que la cognición se adaptará a la estructura del medio óptimamente.

 

Dos tipos de racionalidad: El comportamiento racional es adaptativo si está optimizado al medio del organismo, es decir, si sirve para alcanzar las metas del organismo, y si es coherente con reglas lógicas. ¿De dónde surge la idea del razonamiento como un medio para alcanzar las metas? Los seres humanos tienen la capacidad demostrada de actuar con suma inteligencia para alcanzar las metas y, así, promover la supervivencia de la especie, y la prosperidad de algunos, si bien, al mismo tiempo, la situación se les torna más compleja cuando sus procesos de razonamiento y decisión se ven puestos a prueba. Entonces, parecemos racionales desde un ángulo, e irracionales desde otro.

El término "racional" puede usarse para significar dos cosas fundamentalmente diferentes: la Racionalidad Personal y la Racionalidad Pública; sin embargo, ambas están dirigidas a la meta. Con frecuencia, las dificultades aparecen porque a estos dos significados se les da una apariencia falaz o confusa.

 

Racionalidad Personal: Tomar una decisión de una manera tal que sea generalmente confiable y eficiente para alcanzar las metas personales eficazmente. Este tipo de racionalidad es la Racionalidad basada en un Propósito, es decir, los fines siempre racionalizan los medios, que es una versión de la racionalidad maquiavélica. Es una necesidad de las personas vencer su entrenamiento social y sus ideas tradicionales para buscar una manera propia de tomar decisiones.

 

Racionalidad Pública: Tomar una decisión cuando uno tiene una razón por lo que hace sancionada por la ley y la evidencia requerida. Este tipo de racionalidad es la Racionalidad basada en el Proceso, es decir, el medio debe justificar los fines, dentro del imperio de la ley pertinente. Tiene que ser una decisión responsable y defendible.

 

Lamentablemente, existen otros tipos aislados de racionalidad, tales como el "principio de probar por placer", opuesto a, por ejemplo, el "principio de probar por contradicción". Sin embargo, si no se saben distinguir estos dos tipos distintivos de racionalidad se puede arribar a juicios vacíos o engañosos de la racionalidad humana. Ahora les hago una pregunta: "El debate sobre el aborto, ¿a cuál de estas dos categorías de racionalidad pertenece?" El aborto es una "decisión premeditada de asesinar" o, como declaró una líder feminista: "no pongas tu ley en mi cuerpo". Es una decisión difícil de tomar.

 

Análisis de decisiones: decisiones justificables y defendibles

 

El análisis de decisiones es la disciplina que consiste en evaluar alternativas complejas en términos de valores (habitualmente en $ porque es lo que a los gerentes les importa) y de incertidumbre (lo que no conocemos). El análisis de decisiones brinda información sobre las diferencias entre las alternativas definidas, y genera sugerencias de nuevas y mejores alternativas. Usamos números para cuantificar valores e incertidumbres subjetivos, lo cual nos permite comprender la situación de decisión. Los resultados numéricos deben reconvertirse para generar información cualitativa.

 

Los seres humanos pueden comprender, comparar y manipular números. Por lo tanto, para crear un modelo de análisis de decisiones es necesario crear la estructura del modelo y asignar las probabilidades y los valores para poblar el modelo de computación. Aquí se incluyen los valores para las probabilidades, las funciones de valor para evaluar alternativas, las ponderaciones de valor para medir la concesión que se debe hacer entre los objetivos, y la preferencia de riesgo.

 

Una vez definidos la estructura y los números, el análisis puede comenzar. El Análisis de Decisiones implica mucho más que calcular la utilidad esperada y ponderada de cada alternativa. Si nos detuviéramos aquí, los decisores no tendrían demasiada información. Tenemos que examinar la sensibilidad de la utilidad esperada y ponderada para las probabilidades clave, y los parámetros de ponderación y preferencia de riesgo. Como parte del análisis de sensibilidad podemos calcular el valor de la información perfecta para incertidumbres que han sido modelizadas explícitamente.

 

Entre las comparaciones cuantitativas adicionales se incluye la comparación directa de la utilidad ponderada para dos alternativas en todos los objetivos y la comparación de todas las alternativas en dos objetivos seleccionados, demostrando la optimalidad de Pareto para estos dos objetivos.

 

La complejidad del mundo moderno, junto con la cantidad de Información, la Incertidumbre y el Riesgo, requieren un marco racional para la toma de decisiones. Las metas del análisis de decisiones son las siguientes: incorporar orientación, información, discernimiento y estructura al proceso de toma de decisión, para que ésta pueda ser mejor y más "racional".

 

Toda decisión necesita un decisor responsable. El decisor tiene varias alternativas, y debe elegir una. El objetivo del decisor es elegir la mejor alternativa. Después de que se ha tomado la decisión, pueden producirse eventos sobre los que el decisor no tiene control. Cada combinación de alternativas elegida, seguida por un evento, conduce a un resultado con algún valor mensurable. Los gerentes toman decisiones en situaciones complejas. Las matrices de árbol de decisiones y pago describen estas situaciones y añaden estructura a los problemas

 

Elementos de los modelos de análisis de decisiones

Las teorías y las técnicas matemáticas que se toman en consideración en el análisis de decisiones se ocupan de las teorías de elección prescriptivas (acción). Es decir, la cuestión aquí es ver exactamente de qué modo se comporta un decisor cuando se enfrenta a una elección entre cursos de acción, cuyos resultados están regidos por el azar o las acciones de los competidores.

El análisis de decisiones es un proceso que le permite al decisor seleccionar una decisión (sólo una) entre un conjunto de alternativas posibles de decisión, cuando existe incertidumbre con respecto al futuro, con el objetivo de optimizar el pago (retorno) resultante, en términos de algún tipo de criterio de decisión numérico. Los elementos de los problemas de análisis de decisiones son los siguientes:

1.       Hay un decisor responsable individual. Por ejemplo, el CEO de una compañía que quizás deba rendir cuentas ante los accionistas.

2.       Un número finito de eventos (futuros) posibles, llamados Estados de la Naturaleza, es decir, un conjunto de escenarios posibles. Las circunstancias en las cuales se toma una decisión se llaman estados de la naturaleza. Los estados de la naturaleza se identifican y agrupan en el conjunto S; los miembros se denotan como s. El conjunto S es un grupo de conjuntos mutuamente excluyentes. Es decir, sólo puede ocurrir un estado de la naturaleza. ¿Qué puede hacer la naturaleza?

3.       Un número finito de alternativas posibles de decisión. Hay una acción a, miembro del conjunto A, que puede ser adoptada por el decisor. Sólo puede adoptar una. ¿Qué puedo hacer? Una buena decisión requiere buscar un conjunto más rico de alternativas que las que se presentaron inicialmente o que las aceptadas tradicionalmente. Sea breve en la parte de la lógica y la razón de su decisión. Es probable que existan mil cosas en un automóvil, pero usted no las necesita todas para tomar la decisión. Con media docena es suficiente.

4.       La manera más sencilla de formular el problema de decisión es usando una matriz de beneficios (tabla). Hay una matriz de beneficios X bien definida, monetaria (y luego de utilidad) sobre dos conjuntos de dominio dimensionales A y S. Las filas y las columnas se asignan a las alternativas de decisión posibles y a los estados posibles de la naturaleza, respectivamente. Normalmente no es tarea sencilla construir esta matriz; por lo tanto, puede requerir algo de práctica.

Fuente de errores en la toma de decisiones: La fuente principal de errores en los problemas de toma de decisiones arriesgadas son las presunciones falsas, no tener una estimación exacta de las probabilidades, depender de la expectativa, dificultades en medir la función de utilidad, y los errores de pronóstico.

 

Componentes de un modelo probabilístico

Considere el siguiente Problema de Decisión de Inversión:

 

 

Ejemplo de decisión de inversión:

Cursos de acción

Estados de la naturaleza

 

Crecimiento

Crecimiento medio

Sin cambio

Bajo

 

C

CM

SC

B

Bonos

12%

8

6

3

Acciones

15

7

3

-2

Depósito

7

7

7

7

Los estados de la naturaleza son los estados de la economía durante un año.

 

Hacer frente a las incertidumbres

 

Continuo de incertidumbre pura y certidumbre: El dominio de los modelos de análisis de decisiones está entre los siguientes dos casos extremos, dependiendo del grado de conocimiento que tenemos sobre el resultado de nuestras acciones, como se muestra a continuación:

 

Ignorancia

Situación de riesgo

Conocimiento completo

Modelo de incertidumbre pura

Modelo probabilístico

Modelo determinista

Uno de los "polos" de esta escala es determinista, como en el caso de la programación lineal. El "polo" opuesto es la incertidumbre pura. Entre estos dos hay problemas con riesgo. La idea principal, aquí, es que para un problema dado, el grado de certidumbre varía según el gerente, dependiendo de la cantidad de conocimiento que cada gerente tenga sobre el mismo problema y refleja la solución diferente que cada persona recomienda.

La probabilidad es un instrumento para medir las chances de que un evento ocurra. Cuando se usa probabilidad se expresa la incertidumbre, el lado determinista tiene una probabilidad de 1 (o cero), mientras que el otro extremo tiene una probabilidad plana (todas igualmente probables). Por ejemplo, si usted tiene certidumbre de la ocurrencia (o no ocurrencia) de un evento, usa una probabilidad de uno (o cero). Si usted tiene incertidumbre, entonces usa la expresión "En realidad no sé", por lo tanto, puede o no ocurrir con una probabilidad del 50%. Esta es la noción de Bayes de que la evaluación de la probabilidad siempre es subjetiva. Es decir, la probabilidad siempre depende de cuánto conoce el decisor. Si sabe todo lo que puede saber, la probabilidad pasará a ser 1 o 0.

Las situaciones de decisión con incertidumbre plana presentan el riesgo más grande. Para fines de simplicidad, considere el caso en que hay sólo dos resultados con una probabilidad de p. Así, la variación en los estados de la naturaleza es p(1-p). Esta variación es la mayor si definimos p = 50%. Es decir, igual chance para cada resultado. En tal caso, la calidad de la información está en su nivel más bajo. Recuerden de Estadística que la calidad de la información y la variación están inversamente relacionadas. Una variación mayor de los datos implica una disminución en la calidad de los datos (es decir, de la información).

La información relevante para resolver un problema de decisión achica nuestra probabilidad plana. La información de utilidad desplaza la ubicación de un problema desde el "polo" de la pura incertidumbre hacia el "polo" determinista. La información relevante y útil achica la incertidumbre. .

La evaluación de la probabilidad no es más que la cuantificación de la incertidumbre. En otras palabras, la cuantificación de la incertidumbre permite comunicar la incertidumbre entre las personas, como la incertidumbre entre eventos, estados del mundo, creencias, etc. La probabilidad es la herramienta para comunicar la incertidumbre y para manejar la incertidumbre (domar el cambio).

Existen tipos diferentes de modelos de decisión que ayudan a analizar distintos escenarios, dependiendo de la cantidad y el grado de conocimiento que tengamos. Los tres tipos más ampliamente utilizados son:

·         Decisión tomada con pura incertidumbre,

·         Decisión tomada con riesgo,

·         Decisión tomada comprando información (empujando el problema hacia el "polo" determinista)

En las decisiones tomadas con pura incertidumbre, el decisor no tiene ningún conocimiento, ni siquiera de la probabilidad de ocurrencia de cualquier estado de la naturaleza. En estas situaciones, el comportamiento del decisor se basa puramente en su actitud hacia la incógnita. Algunos de estos comportamientos son los optimistas, los pesimistas y los de arrepentimiento, entre otros

Optimista: El vaso está medio lleno.

Pesimista: El vaso está medio vacío.

Gerente: El vaso es el doble de grande de lo necesario.

Observe que esta categoría de problemas (es decir, los problemas con pura incertidumbre) resultan apropiados sólo para la toma de decisiones en la vida privada. No obstante, la persona pública (es decir, el gerente) tiene que tener cierto conocimiento de los estados de la naturaleza, para poder predecir las probabilidades de cada estado. De lo contrario no podrá tomar una buena decisión que sea razonable y defendible.

Siempre que un decisor tiene cierto conocimiento sobre los estados de la naturaleza puede asignar una probabilidad subjetiva a la ocurrencia de cada estado. Y cuando lo hace, el problema se clasifica como toma de decisiones bajo riesgo.

En muchos casos, el decisor puede necesitar la opinión de un especialista para limitar sus incertidumbres con respecto a la probabilidad de cada estado de la naturaleza. En tal caso, el decisor puede comprar información relevante a especialistas, para poder tomar una mejor decisión. El procedimiento para incorporar el asesoramiento de un experto en las incertidumbres del decisor se conoce como el abordaje de Bayes.

Por ejemplo, en una situación donde se debe tomar una decisión de inversión, se debe responder la siguiente pregunta: ¿En qué estado estará la economía el año próximo? Supongamos que limitamos las posibilidades a: Crecimiento (G), Igualdad (S), o Declinación (D); entonces, una representación típica de nuestra incertidumbre podría ilustrarse de la siguiente manera:

 

Toma de decisiones con pura incertidumbre

 

Cuando las decisiones se toman con pura incertidumbre, el decisor no tiene conocimiento de los resultados de ninguno de los estados de la naturaleza y/o es costoso obtener la información necesaria. En tal caso, la decisión depende meramente del tipo de personalidad que tenga el decisor.



 

 

Comportamiento según los tipos de personalidad y la toma de decisiones con pura incertidumbre

Pesimismo, o Conservador (Maximin). Hipótesis de mínima. Las cosas malas siempre me suceden a mí.

 

 

B

3

 

a) Escriba el número mínimo en cada fila de acción.

A

-2

 

b) Elija el número máximo y realice esa acción.

D

7

*

 

Optimismo, Agresivo (Maximax). Las cosas buenas siempre me suceden a mí.

 

 

B

12

 

a) Escriba el número máximo en cada fila de acción.

A

15

*

b) Elija el número máximo y realice esa acción.

D

7

 

 

Coeficiente de Optimismo (Indice de Hurwicz), ). A mitad de camino: Ni demasiado optimista ni demasiado pesimista:

a) Elija a entre 0 y 1, 1 significa optimista y 0 significa pesimista,

b) Elija los números más alto y más bajo para cada acción,

c) Multiplique el beneficio más alto (en el sentido de las filas) por a y el más bajo por (1-a),

d) Opte por el curso de acción que da la suma más alta.

Por ejemplo, para a= 0.7, tenemos:

B

(.7*12)

+

(.3*3)

=

9.3

A

(.7*15)

+

(.3*-2)

=

9.9 *

D

(.7*7)

+

(.3*7)

=

7

 

Mínimo arrepentimiento: (Pérdida de Oportunidad de Savage). Odio las lamentaciones. Debo minimizar las situaciones deplorables. Mi decisión debe ser tal que valga la pena repetirla. Sólo debería hacer las cosas que siento que podría repetir con placer. Este es, posiblemente, el mejor criterio a aplicar en las situaciones donde debe tomarse una decisión que puede generar problemas u oportunidades.

El arrepentimiento es el beneficio o rédito de la que hubiera sido la mejor decisión, dadas las circunstancias, menos el beneficio de la decisión tomada concretamente, dadas las circunstancias.

a)      Configure una tabla de arrepentimiento: Tome el número más alto de cada una de las columnas correspondientes a los estados de la naturaleza (por ejemplo, L) y réstele todos los números de dicha columna, es decir, L - Xi,j.

 

Matriz de Arrepentimiento

 

 

C

CM

SC

B

Paso b

Bonos

(15-12)

(8-8)

(7-6)

(7-3)

4 *

Acciones

(15-15)

(8-7)

(7-3)

(7+2)

9

Depósito

(15-7)

(8-7)

(7-7)

(7-7)

8


b) Elija el número máximo de cada acción,

c) Elija el número mínimo en Paso b, y adopte esa acción.

Yo no sé nada: Todos los estados de la naturaleza tienen igual probabilidad. Como yo no sé nada sobre la naturaleza, todo es igualmente probable (Laplace):

a) Para cada estado de la naturaleza ponga una probabilidad igual (es decir, probabilidad plana),
b) Multiplique cada número por la probabilidad,

 

C

CM

SC

B

Beneficio esperado

Bonos

0.25(12)

0.25(8)

0.25(6)

0.25(3)

7.25 *

Acciones

0.25(15)

0.25(7)

0.25(3)

0.25(-2)

5.75

Depósito

0.25(7)

0.25(7)

0.25(7)

0.25(7)

7

c) Añada filas de cursos de acción y complete la columna Beneficio Esperado,
d) Elija el número máximo en Paso c, y adopte ese curso de acción.

 

Toma de decisiones con riesgo

 

Cuando el decisor posee algún conocimiento sobre los estados de la naturaleza puede asignarle a la ocurrencia de cada estado alguna estimación subjetiva de probabilidad. En estos casos, el problema se clasifica como de toma de decisiones con riesgo. El decisor puede asignar probabilidades a la ocurrencia de los estados de la naturaleza. El proceso de toma de decisión con riesgo es el siguiente:

a) Use la información que tenga para asignar su parecer personal (llamado probabilidades subjetivas) sobre el estado de la naturaleza, p(s);

b) Cada curso de acción tiene asociado un determinado beneficio con cada uno de los estados de la naturaleza, X(a,s);

c) Calculamos el beneficio esperado, también llamado riesgo o R, correspondiente a cada curso de acción como R(a) = Suma de [X(a,s) p(s)];

d) Aceptamos el principio que dice que deberíamos actuar para minimizar (o maximizar) el beneficio esperado;

e) Ejecute la acción que minimice R(a).

Beneficio esperado: El resultado real no será igual al valor esperado. Lo que se obtiene no es lo que se espera, es decir, las "Grandes Expectativas".

a)      Con cada acción, multiplique la probabilidad y el beneficio y luego sume: Elija el número más grande y adopte esa acción.

b)       

 

C(0.4)

 

CM(0.2)

 

SC(0.3)

 

B(0.1)

 

Valor esperado

Bonos

0.4(12)

+

0.2(8)

+

0.3(6)

+

0.1(3)

=

8.5*

Acciones

0.4(15)

+

0.2(7)

+

0.3(3)

+

0.1(-2)

=

8.1

Depósito

0.4(7)

+

0.2(7)

+

0.3(7)

+

0.1(7)

=

7

 

Los estados más probables de la naturaleza: (apropiado para decisiones no repetitivas)

a) Tome el estado de la naturaleza que tiene la probabilidad más alta (rompa los empates arbitrariamente),

b) En esa columna, elija la acción que tiene el mayor beneficio,

En nuestro ejemplo numérico, el Crecimiento tiene una chance del 15%, por eso debemos comprar Acciones.

Pérdida de oportunidad esperada (POE):

a) Configure una matriz de beneficios de la pérdida tomando el número más alto de las columnas correspondientes a los estados de la naturaleza (digamos, L) y réstele todos los números de esa columna, L - Xij.

Matriz de Beneficios de Pérdida

 

 

C(0.4)

 

CM(0.2)

 

SC(0.3)

 

B(0.1)

POE

Bonos

0.4(15-12)

+

0.2(8-8)

+

0.3(7-6)

+

0.1(7-3)

1.9 *

Acciones

0.4(15-15)

+

0.2(8-7)

+

0.3(7-3)

+

0.1(7+2)

2.3

Depósito

0.4(15-7)

+

0.2(8-7)

+

0.3(7-7)

+

0.1(7-7)

3.4


b) Con cada curso de acción, multiplique la probabilidad por la pérdida y luego sume.

c) Elija la acción que tenga la POE más baja.

Cálculo del Valor Esperado de la Información Perfecta (VEIP)

El VEIP nos ayuda a considerar el valor que tienen las personas informadas (por ejemplo, el demonio), que son las dueñas de la información perfecta. Recuerde que el VEIP = POE.

a) Tome el beneficio máximo de cada estado de la naturaleza,

b) Multiplique cada uno por la probabilidad de que ocurra ese estado de la naturaleza y luego súmelos,

 

 

C

15(0.4)

=

6.0

CM

8(0.2)

=

1.6

SC

7(0.3)

=

2.1

B

7(0.1)

=

0.7

SUMA

 

 

10.4

VEIP = 10,4 - Beneficio Esperado = 10.4 - 8.5 = 1.9. Verifique si la PEO = VEIP

Por lo tanto, si la información cuesta más del 1.9% de la inversión no la compre. Por ejemplo, si usted va a invertir $100.000, el máximo que deberá pagar por la información que compre será de [100.000 * (1.9%)] = $1,900.

Cómo tomar una mejor decisión comprando información confiable (Abordaje de Bayes)

En muchos casos, el decisor puede necesitar la opinión de un especialista para reducir sus incertidumbres con respecto a la probabilidad de cada uno de los estados de la naturaleza. Por ejemplo, consideremos el siguiente problema de decisión concerniente a la producción de un nuevo producto:

 

 

Estados de la naturaleza

Mucha venta

Venta media

Poca venta

A(0.2)

B(0.5)

C(0.3)

A1

(desarrollar)

3000

2000

-6000

A2

(no desarrollar)

0

0

0

 

Las probabilidades de los estados de la naturaleza representan los distintos grados que tiene el criterio del decisor (por ejemplo, un gerente) con respecto a la ocurrencia de cada estado. Nos referiremos a estas evaluaciones subjetivas de la probabilidad como probabilidades "a priori".

El beneficio esperado de cada curso de acción es A1 = 0.2(3000) + 0.5(2000) + 0.3(-6000) = $ -200 y A2 = 0; entonces elegimos A2, que significa que no desarrollamos.

Sin embargo, el gerente se siente algo reacio a tomar esta decisión; por ello solicita la asistencia de una firma de investigación de mercado. Ahora nos enfrentamos a una nueva decisión. Es decir, con cuál firma de investigación de mercado debe consultar su problema de decisión. Es así que el gerente debe tomar una decisión acerca de cuán "confiable" es la firma consultora. Mediante muestreo y luego analizando el desempeño previo de la consultora debemos desarrollar la siguiente matriz de confiabilidad:

Lo que el consultor

predijo

 

Qué sucedió realmente en el pasado

 

A

B

C

Ap

0.8

0.1

0.1

Bp

0.1

0.9

0.2

Cp

0.1

0.0

0.7

Todas las Firmas de Investigación de Mercado llevan registros (es decir, conservan datos históricos) del desempeño alcanzado en relación con las predicciones anteriores que hubieren formulado. Estos registros los ponen a disposición de sus clientes sin cargo alguno. Para construir una matriz de confiabilidad debe tomar en consideración los "registros de desempeño" de la Firma de Investigación de Mercado correspondientes a los productos que tienen mucha venta, y luego hallar el porcentaje de los productos que la Firma predijo correctamente que tendrían mucha venta, venta media y poca o ninguna venta. Estos porcentajes se representan como P(Ap|A) = 0.8, P(Bp|A) = 0.1, P(Cp|A) = 0.1, en la primera columna de la tabla anterior, respectivamente. Se debe efectuar un análisis similar para construir las otras columnas de la matriz de confiabilidad.

Observe que para fines de consistencia, las entradas de cada columna en la matriz de confiabilidad deberían sumar uno.

a) Tome las probabilidades y multiplíquelas "hacia abajo" en la matriz, y luego súmelas:

0.2

0.5

0.3

 

A

B

C

SUMA

02(0.8) = 0.16

0.5(0.1) = 0.05

0.3(0.1) = 0.03

0.24

0.2(0.1) = 0.02

0.5(0.9) = 0.45

0.3(0.2) = 0.06

0.53

0.2(0.1) = 0.02

0.5(0) = 0

0.3(0.7) = 0.21

0.23

b) SUMA es el resultado de sumar en sentido horizontal.

c) Es necesario normalizar los valores (es decir, que las probabilidades sumen 1) dividiendo el número de cada fila por la suma de la fila hallada en el paso b.

A

B

C

(.16/.24)=.667

(.05/.24)=.208

(.03/.24)=.125

(.02/.53)=.038

(0.45/.53)=.849

(.06/.53)=.113

(.02/.23)=.087

(0/.23)=0

(0.21/.23)=.913

d) Dibuje el árbol de decisiones. Muchos ejemplos gerenciales, como el de este ejemplo, involucran una secuencia de decisiones. Cuando una situación de decisión requiere que se tome una serie de decisiones, el abordaje de la tabla de pago puede no dar cabida a las múltiples capas de decisiones. Para ello se aplica el abordaje del árbol de decisiones.

El árbol de decisiones es una representación cronológica del proceso de decisión, mediante una red que utiliza dos tipos de nodos: los nodos de decisión, representados por medio de una forma cuadrada (el nodo de elección), y los nodos de estados de la naturaleza, representados por círculos (el nodo de probabilidad). Dibuje la lógica del problema construyendo un árbol de decisiones. Para los nodos de probabilidad asegúrese de que las probabilidades en todas las ramas salientes sumen uno. Calcule los beneficios esperados retrocediendo en el árbol, comenzando por la derecha y trabajando hacia la izquierda.

Usted puede imaginarse el conducir de su coche, el comenzar en el pie del árbol de la decisión y el trasladarse a la derecha a lo largo de las ramificaciones. En cada nodo cuadrado usted tiene control, puede tomar una decisión, y da vuelta a la rueda de su coche. En cada nodo del círculo la señora Fortuna asume el control la rueda, y usted es impotente.

A continuación se indica una descripción paso a paso de cómo construir un árbol de decisiones:

1.       Dibuje el árbol de decisiones usando cuadrados para representar las decisiones y círculos para representar la incertidumbre.

2.       Evalúe el árbol de decisiones, para verificar que se han incluido todos los resultados posibles.

3.       Calcule los valores del árbol trabajando en retroceso, del lado derecho al izquierdo.

4.       Calcule los valores de los nodos de resultado incierto multiplicando el valor de los resultados por su probabilidad (es decir, los valores esperados).

Podemos calcular el valor de un nodo del árbol cuando tenemos el valor de todos los nodos que siguen. El valor de un nodo de elección es el valor más alto de todos los nodos que le siguen inmediatamente. El valor de un nodo de probabilidad es el valor esperado de los valores de los nodos que le siguen, usando la probabilidad de los arcos. Retrocediendo en el árbol, desde las ramas hacia la raíz, se puede calcular el valor de todos los nodos, incluida la raíz del árbol. Al poner estos resultados numéricos en el árbol de decisiones obtenemos como resultado el siguiente gráfico:

Árbol de decisiones típico

Referencias de la figura

No Consultant = Sin consultor;

$500 fee = $500 por honorarios;

Hire Consultant = Contratar consultor

Determine la mejor decisión con el árbol partiendo de la raíz y avanzando.

Del árbol de decisiones surge que nuestra decisión es la siguiente:

Contratar al consultor y luego aguardar su informe. Si el informe predice muchas ventas o ventas medias, entonces producir el producto. De lo contrario, no producirlo.

Verifique la eficiencia del consultor (%) calculando el índice: (Beneficio esperado recurriendo al consultor {monto en $}) / VEIP. El beneficio esperado recurriendo al consultor surge del gráfico como
BE = 1000 - 500 = 500, mientras que VEIP = .2(3000) + .5(2000) + .3(0) = 1600.
Por lo tanto, la eficiencia de este consultor es: 500/1600 = 31%

 

Determinación de la función de utilidad del decisor

 

La retribución monetaria esperada que se asocia con las diversas decisiones puede no ser razonable por las siguientes dos razones importantes:

1. El valor en pesos puede no expresar auténticamente el valor personal que el resultado tiene para uno. Esto es lo que motiva a algunas personas a jugar a la lotería por $1.

2. Si usted acepta los valores monetarios esperados es probable que no esté reflejando con exactitud su aversión al riesgo. Por ejemplo, supongamos que tiene que elegir entre que le paguen $10 por no hacer nada, o participar de una apuesta cuyo resultado depende del lanzamiento de una moneda al aire, pudiendo ganar $1.000 si sale cara y perder $950 si sale cruz. La primera alternativa tiene una recompensa esperada de $10; la segunda tiene una recompensa esperada de 0.5(1000) + 0.5(- 950) = $25, y es claramente preferible a la primera (si la recompensa monetaria esperada fuere un criterio razonable). Pero usted quizás prefiera $10 seguros antes que correr el riesgo de perder $950.

¿Por qué algunas personas contratan seguros y otras no? El proceso de toma de decisiones involucra factores psicológicos y económicos, entre otros. El concepto de utilidad es un intento de medir el provecho que tiene el dinero para el decisor en lo individual. Con el concepto de la utilidad podemos explicar por qué, por ejemplo, algunas personas compran billetes de lotería por un peso para ganar un millón de pesos. Para estas personas, $1 (1.000.000) es menos que ($10.000.000). Por lo tanto, para tomar una decisión acertada considerando la actitud que tiene el decisor con respecto al riesgo, debemos convertir la matriz de beneficios monetarios en una matriz de utilidad. La principal pregunta sería: ¿Cómo se mide la función de la utilidad con cada decisor?

Consideremos nuestro Problema de Decisión de Inversión. ¿Cuál sería la utilidad de $12?

a) Asigne 100 unidades de utilidad y 0 unidades de utilidad al elemento más grande y al más pequeño, respectivamente, de la matriz de beneficios. En nuestro ejemplo numérico, asignamos 100 unidades de utilidad a 15, y 0 unidades de utilidad a -2,

b) Pídale al decisor que elija entre las siguientes hipótesis:

Recibir $12 por no hacer nada

O

Jugar el siguiente juego: ganar $15 con probabilidad (p) y -$2 con probabilidad (1-p), donde p es un número seleccionado entre 0 y 1.

Cambiando el valor de p, y repitiendo una pregunta similar, existe un valor de p con el que el decisor es indiferente ante las dos hipótesis. Digamos, p = 0.48.

c) Ahora, la utilidad para $12 es igual a 0.48(100) + (1-0.48)(0) = 48.

d) Repita el mismo proceso para hallar las utilidades de cada elemento de la matriz de beneficios. Supongamos que definimos la siguiente matriz de utilidad:

Matriz de Beneficio Monetario

 

Matriz de Beneficio de Utilidad

A

B

C

D

 

A

B

C

D

12

8

6

3

 

48

34

28

13

15

7

3

-2

 

100

19

13

0

7

7

7

7

 

19

19

19

19

Ahora se puede aplicar cualquiera de las técnicas antes analizadas a esta matriz de utilidad (en lugar de monetaria) para tomar una decisión satisfactoria. Queda claro que la decisión podría ser diferente.

Evaluación del riesgo: ¿Cuán acertada es su decisión?

 

Considerando nuestro Problema de Decisión de Inversión:

 

Cursos de acción

 

Estados de la Naturaleza

Crecimiento

Crec. medio

Sin cambio

Bajo

C

CM

SC

B

Bonos

12%

8

6

3

Acciones

15

7

3

-2

Depósito

7

7

7

7

Los estados de la naturaleza son los estados de la economía durante, digamos, un año. El Valor Esperado (es decir, promedios):

Valor esperado = å x i . P(x i)

por sí solo no indica adecuadamente que la decisión es de calidad acertada. Se necesita saber la varianza para tomar una decisión educada. ¿Alguna vez les contaron del dilema del estadístico que medía 1,80 metros y se ahogó en un arroyo que tenía 90 cm de profundidad promedio?

En nuestro ejemplo numérico también nos interesa el "riesgo" comparativo entre los cursos de acción alternativos. Una de las medidas del riesgo en general se expresa como variación, o su raíz cuadrada, llamada desviación estándar. La variación, o la desviación estándar, son valores numéricos que indican la variabilidad inherente a la decisión. Si el valor del riesgo es más bajo indica que lo que usted esperaba obtener es más probable. Por lo tanto, el riesgo también podría usarse para comparar cursos de acción alternativos. Lo que deseamos es un mayor retorno esperado con menor riesgo. Es por ello que al gerente le preocupa tanto el alto riesgo.

Varianza: Una medida importante del riesgo es la varianza.

Varianza = [åxi . x i . P(xi)] - (Valor esperado)2

La varianza es una medida del riesgo; por lo tanto, cuanto mayor la varianza, mayor el riesgo. La varianza no se expresa en las mismas unidades que el valor esperado (digamos, en $). En otras palabras, la varianza es difícil de entender y explicar porque es el término al cuadrado de su cálculo. Este problema puede resolverse trabajando con la raíz cuadrada de la varianza, llamada desviación estándar.

Desviación estándar = (Varianza) 1/2

Ambas, la varianza y la desviación estándar, proporcionan la misma información; siempre se puede obtener una de la otra. En otras palabras, el proceso de calcular una desviación estándar siempre involucra el cálculo de una varianza. Como la desviación estándar es la raíz cuadrada de la varianza, siempre se expresa en las mismas unidades que el valor esperado.

Ahora, la pregunta es "¿qué curso de acción tomar entre uno que tiene un resultado esperado mayor y otro, con resultado esperado menor pero riesgo mucho mayor?" Para tomar una decisión acertada en estos casos, se puede usar otra medida de riesgo, conocida como el Coeficiente de Variación. El Coeficiente de Variación (C.V.) es el riesgo relativo con respecto al Valor Esperado, que se define como:

 

El Coeficiente de Variación (C.V.) = (Desviación estándar / Valor esperado)100 %

 

Observe que el C.V. es independiente de la medida de unidad de valor esperado. La inversa de CV (es decir, 1/CV) se llama Relación Señal/Ruido. El coeficiente de variación se usa para representar la relación entre la desviación estándar y el valor esperado; expresa el riesgo como porcentaje del valor esperado.

La siguiente tabla muestra las mediciones de riesgo calculadas para el Problema de Decisión de Inversión:

 

 

 

 

 

 

 

Evaluación del riesgo

 

C(0.4)

CM(0.2)

SC(0.3)

B(0.1)

Valor esperado

Desviación estándar

C. V.

Bonos

12

8

6

3

8.5

3.22

38%

Acciones

15

7

3

-2

8.1

6.27

77%

Depósito

7

7

7

7

7

0

0%

 

De las columnas Evaluación del Riesgo en la tabla se llega a la conclusión de que los Bonos son mucho menos riesgosos que las Acciones. Es claro que el Depósito está exento de riesgo. Ahora, la última pregunta es: Con toda la información relevante, ¿qué curso de acción asumir? Todo depende de usted.


TEORIA DE JUEGOS

 

Introducción

 

Algunos Fundamentos

 

La teoría de juego es un enfoque distinto e interdisciplinario al estudio del comportamiento humano. Las disciplinas más implicadas en la teoría de juego son las matemáticas, economía y otras ciencias sociales y del comportamiento. La teoría de juego (como  teoría computacional y tantas otras contribuciones) fue fundada por el gran matemático John von Neumann. El primer libro importante  fue La Teoría de Juegos y el Comportamiento Económico, que von Neumann escribió en la colaboración con el gran economista matemático, Oskar Morgenstern. Seguramente Morgenstern trajo ideas desde la  economía neoclásica , pero von Neumann, era bien consciente de ellas y tuvo otras contribuciones a la economía neoclásica.

 

Una Metáfora Científica

 

Desde el trabajo de John von Neumann, "los juegos" han sido una metáfora científica para una gama mucho más amplia de interacciones humanas en que los resultados depende de las estrategias interactivas de dos o más personas. Entre los puntos discutido en la teoría de juego son:

¿ 1) qué significa  escoger las estrategias "racionalmente" cuando los resultados dependen de las estrategias elegidas por otros y cuando la información es incompleta? 

¿ 2) En "juegos" que permiten ganancia mutua (o pérdida mutua)  es "racional" colaborar para obtener la ganancia mutua (o evitar la pérdida mutua) o es "racional" actuar agresivamente en la búsqueda de la ganancia individual sin considerar pérdida o ganancia mutua? 

¿ 3) Si la respuestas a 2) son "a veces", en qué circunstancias es la agresión racional y en qué circunstancias es la cooperación racional? 

¿ 4) en particular, difieren las relaciones en proceso desde uno - fuera de encuentros en esta conexión? 

¿ 5) Pueden las reglas morales de cooperación surgir espontáneamente desde las interacciones de racionales egoístas? 

¿ 6) Cómo corresponde el comportamiento humano verdadero al "racional" comportamiento en este caso?

¿ 7) Si difiere, en qué dirección? ¿ Es la gente más cooperativa que a ? ¿ Ambos?

 

Racionalidad

 

El nexo clave entre la teoría de juego y la economía neoclásica era y es la racionalidad. La economía neoclásica está basada en la suposición que los seres humanos son absolutamente racionales en sus elecciones económicas. Específicamente, la suposición es que cada persona aumenta al máximo sus gratificaciones - - ganancias, ingresos, o beneficios subjetivos - - en las circunstancias que ella o él encara. Esta hipótesis sirve a un propósito doble en el estudio de la asignación de los recursos. El primero, estrecha la gama de posibilidades. El comportamiento absolutamente racional es más predecible que el comportamiento irracional. El segundo, provee un criterio para la evaluación de la eficiencia de un sistema económico. Si el sistema conduce a una reducción en las gratificaciones que vienen a alguna gente, sin producir más gratificaciones compensatorias a otros (costos mayores que beneficios) entonces algo está mal. La contaminación, las sobre explotación de pesquerías, y los recursos inadecuados comprometidos para investigar pueden  ser ejemplos de esto.

En economía neoclásica, las caras individuales racionales de un sistema específico de instituciones, incluyendo derechos de propiedad, dinero, y mercados ultracompetitivos. Estas están entre las "circunstancias" que la persona toma en cuenta al maximizar las ganancias. Las implicaciones de los derechos de propiedad, una economía de dinero y los mercados idealmente competitivos es que el individuo no necesita considerar  sus interacciones con otros individuos. Ella o él necesita considerar sólo su situación propia y las "condiciones del mercado." Pero esto conduce a dos problemas. El primero, limita la gama de la teoría. Donde siempre la competencia se restringe (pero no hay monopolio), o los derechos de propiedad  no están definidos totalmente, el consenso de la teoría económica neoclásica es inaplicable, y la economía neoclásica nunca ha producido una extensión generalmente aceptada de la teoría para cubrir estos casos. Las decisiones tomadas afuera la economía de dinero eran también problemáticas para la economía neoclásica.

La teoría de juego se destinó para enfrentar simplemente este problema: para proveer una teoría de comportamiento económico y estratégico cuando la gente obra recíprocamente directamente, más bien que "mediante el mercado." En la teoría de juego, "los juegos" han siempre sido una metáfora para interacciones más serias en la sociedad humana. La teoría de juego puede actuar sobre el póker y fútbol, pero no sobre el ajedrez, y está sobre interacciones serias como la competición de mercado, la carrera armamentista y la contaminación ambiental. Pero la teoría de juegos dirige las interacciones serias que usan la metáfora de un juego: en estas interacciones serias, como en juegos, la elección del individuo es esencialmente una elección de una estrategia, y el resultado de la interacción depende de las estrategias elegidas por cada uno de los participantes. Sobre esta interpretación, un estudio de juegos puede desde luego contarnos algo sobre interacciones serias. ¿ Pero cuánto?

En la teoría económica neoclásica, para escoger racionalmente aumentar al máximo sus ganancias. Desde un punto de vista, este es un problema en matemáticas: escoja la actividad que aumenta al máximo sus ganancias en circunstancias determinadas. Así nosotros podemos pensar en elecciones económicas racionales como la "solución" al problema de matemáticas. En la teoría de juegos, el caso es más complejo, desde que el resultado depende no solamente de mis estrategias propias y las " las condiciones de mercado," sino también directamente de las estrategias elegidas por otros, pero nosotros podemos pensar todavía de la elección racional de estrategias como un problema matemático - - aumentando al máximo las gratificaciones de un grupo de tomadores de decisión - - y  nosotros nuevamente hablamos del resultado racional como la "solución" al juego.

 

     El éxito de los grupos humanos organizados como la empresa, los partidos políticos o las naciones depende en gran medida de las decisiones que adoptan sus líderes. Ellas serán acertadas en la medida en que estos personajes sean capaces de entender y predecir la forma en que sus clientes, competidores, adversarios y políticos entre otros, reaccionarán frente a sus acciones. Esta empatía en el arte de dirigir es expresada por Abraham Lincoln:

     "Cuando me estoy preparando para razonar con un hombre, gasto un tercio del tiempo pensando en mí y qué le voy a decir, y dos tercios pensando en él y qué es lo que me va a decir". 
     Si bien esta habilidad es muy útil en el mundo empresarial y político, también es conveniente pensar en "qué voy a decir dado lo que él me va a decir, y qué dirá él como resultado de lo que le voy a responder a lo que él me va a decir", y así sucesivamente. La Teoría de Juegos intenta de alguna manera apoyar la comprensión de esta interacción recursiva entre distintos agentes, que tal como veremos más adelante, puede alcanzar un nivel considerable de complejidad. 

    Esta área de investigación se inició en 1944 con el libro "Teoría de Juegos y Comportamiento Económico" de John von Neumann y Oskar Morgenstern. Según el primero, el objetivo de dicho trabajo no era analizar juegos como el dominó o el ajedrez, en los cuales las estrategias están claramente delimitadas. Por el contrario, lo que se deseaba era entender como actúan los agentes económicos en situaciones en las que pueden haber malos entendidos, apuestas o engaños. Es así como a pesar de que von Neumann es uno de los matemáticos más importantes de la Historia, su libro dedica un capítulo entero a un tema aparentemente superficial como el poker y el blufeo. 
 
     El libro de von Neumann y Morgenstern abrió una nueva rama de la ciencia que sirvió de marco conceptual para economistas, matemáticos, políticos, biólogos y otros especialistas. 
Entre ellos destacan John Nash, que estudió las condiciones necesarias para que exista un equilibrio o solución en un juego. Posteriormente John Harsanyi analizó los juegos de información incompleta, en los que cada jugador desconoce los costos y beneficios que sus acciones generan sobre sus rivales, Reinhard Selten estudió los juegos dinámicos, en los cuales las decisiones están determinadas por acciones pasadas. En 1994 estos tres investigadores recibieron el Premio Nobel de Economía, considerado como el primero otorgado al estudio de la Estrategia. 
 

     Otros dos académicos ligados a la Teoría de Juegos, William Vickrey y James Mirrless, ganaron el Premio Nobel de Economía en 1996. Entre otros temas Vickrey estudió la manera en que distintos mecanismos de licitación determinan el comportamiento de los oferentes, y Mirrless analizó los efectos de las políticas tributarias en los incentivos para trabajar.

     Se estudiarán las técnicas de modelación de situaciones vinculadas a la Empresa, la Política y la Economía, utilizando herramientas conceptuales como la representación matricial. El objetivo de modelar es determinar cuáles son las reglas del juego y los parámetros estratégicos que definen el resultado de la situación sometida a análisis. A partir de este ejercicio, la persona que está tomando la decisión estará alerta respecto del tipo de información que le permitirá optar por su estrate gia más conveniente. Luego se realizará un análisis más profundo acerca del desarrollo de los juegos modelados, y se introducirán conceptos tales como dominancia de estrategia, resultado de equilibrio, utilidad y valor esperado, entre otros. Son ellos los que permiten descubrir el resultado del juego que muchas veces es contraintuitivo.

     En esta primera parte se presenta como ejemplo el clásico Dilema del Prisionero, modelado mediante una descripción matricial. Un breve análisis muestra que, dadas las reglas del juego, si se adopta una estrategia racional se está empujando a los jugadores a un resultado socialmente irracional. También se modelarán ejemplos de convenios comerciales a través de árboles de opciones, que aunque aparentemente convenientes para las partes, en realidad son muy perjudiciales para sus clientes.

La metodología  de modelación  y posterior resolución de juegos puede ser aplicada a un número de situaciones en que la interacción entre dos  o más agentes está definida por un conjunto de reglas. 
Estas reglas pueden ser formales como los contratos y leyes, o informales como sucede con los códigos de ética. La utilidad de contar con una herramienta de análisis consiste en poder "jugar" de manera más efectiva, gracias a lograr anticipar los movimientos de los otros jugadores. Una segunda utilidad de esta herramienta es poder apoyar el diseño de las reglas del juego que garanticen un conjunto deseado de resultados. Por ejemplo, los entes reguladores del sistema eléctrico o de telecomunicaciones deben diseñar políticas de interacción entre las distintas empresas de su sector ( procedimientos, precios de transferencias, licitaciones) de tal manera que el resultado de la actividad económica sea favorable para la sociedad en su conjunto.

     La Teoría de los Juegos, en síntesis es una disciplina que provee de un marco de análisis matemáticamente  sencillo para el estudio de situaciones de interacción entre gentes cuyas acciones dependen unas de otras. Como toda herramienta conceptual, ésta sirve como complemento, y no como sustituto, a la comprensión e intuición que tiene la persona sobre los temas tratados

 

ELEMENTOS Y REPRESENTACIÓN DE JUEGOS

 

2.1 Elementos

 

     Un juego es el modelo de una situación de interacción estratégica entre dos o más individuos. Se trata de un problema en el cual cada jugador debe tomar decisiones que dependen de las que adoptan otros individuos.

Un juego se define por sus reglas y considera  los siguientes elementos:

·        Jugadores: agentes que toman decisiones que dependen de las acciones y reacciones de otros jugadores.

·        Estrategias: posibilidades de acción con la que cuentan los distintos jugadores.

·        Turnos: orden en la que ocurren las acciones, que pueden ser simultáneas o secuenciales.

·        Pagos : beneficios o costos que enfrentan los jugadores dependiendo del resultado final del juego.

·        Información: datos respecto de las estrategias y pagos que tiene cada jugador al momento de tomar decisiones.

       En general asumiremos que los primeros tres elementos están dados y son de conocimiento común para todos los jugadores. Es decir, cada uno sabe, cada uno sabe que los otros saben, cada uno sabe que los otros saben que los otros saben, etc.

 
2.2 Representación Normal o  Estratégica

 

     La representación Normal o Estratégica muestra el juego a través de una matriz de resultados. A cada uno de los jugadores le corresponde una de las dimensiones de la matriz, y sus estrategias son indicadas a lo largo de dicha dimensión. Los pagos para los jugadores son indicados en cada cuadrante de la matriz. Por razones prácticas, en general sólo se utiliza esta representación para  situaciones con dos jugadores.

 

Uno de los juegos más conocidos de esta manera es el llamado Dilema del Prisionero, que fue formulado por el famoso matemático A.W. Tucker en 1950 durante una conferencia a un grupo de sicólogos en Stanford University. En él dos prisioneros presuntamente autores de un delito fueron aislados para ser sometidos a interrogatorios. El interrogador le ofrece un trato a cada prisionero mediante el cual si la persona confiesa, entonces se le reduce su pena. Dicha rebaja depende de la actitud del otro prisionero, tal como se muestra en la ilustración 1. Si Juan confiesa, entonces la opción de no confesar le significará a Pedro cuatro años de cárcel, en tanto que la de confesar le significará solamente tres.

 

 

     Si Juan no confiesa, entonces la opción de no confesar le significará a Pedro dos años de cárcel, mientras que la de confesar le significará solamente uno. Esto es, para cualquier estrategia que elija Juan, la opción más razonable para Pedro es la de confesar. Lamentablemente para Pedro, el análisis que hace Juan es idéntico, por lo que Juan también elige la estrategia de confesar. En definitiva, el juego se resuelve  de la manera menos conveniente para ambos jugadores: confesar/confesar.

 

MODELACION DE JUEGOS

 

Muchas veces se juzga la actitud de una persona o institución como absurda o mal intencionada. Se dice, por ejemplo, que sus acciones son producto de una falta de cultura o de un análisis inadecuado. Sin embargo, en un gran número de ocasiones la actitud juzgada es mucho más astuta de lo aparente, lo que ocurre es que quien emite el juicio no ha hecho un análisis correcto del juego. Con frecuencia este análisis no necesita ser demasiado sofisticado, basta con identificar un cierto jugador o una cierta estrategia, que no es evidente, pero que de alguna manera está definiendo el juego. 

     La modelación de situaciones de interacción estratégica utilizando la teoría de Juegos puede ayudar a la comprensión y posterior resolución de dichos casos. Utilizando la representación estratégica o la representación dinámica de juegos se deben identificar los Jugadores, las Estrategias, los Turnos y los Pagos involucrados en el juego. Adicionalmente se debe determinar la información manejada en cada etapa, que puede ser incompleta o imperfecta.

 

El término "juegos" se refiere a condiciones de conflicto de negocios en el transcurso del tiempo. Los participantes son competidores que emplean las técnicas matemáticas y el pensamiento lógico a fin de descubrir la mejor estrategia posible para vencer a su/s competidor/es.

 

Todo juego tiene una meta o estado final (ganancia) que los competidores tratan de alcanzar escogiendo cursos de acción apropiados. Aunque el juego pueda favorecer a uno de ellos sobre los demás, cada uno hará cuanto pueda para aumentar al máximo sus ganancias o para reducir al mínimo sus pérdidas.

 

JUEGOS DE SUMA CERO ENTRE DOS PERSONAS

 

En su primer trabajo, von Neumann hizo un descubrimiento llamativo. El encontró que si los jugadores de póker aumentan al máximo sus ganancias, ellos pueden engañar; y, más generalmente, que en muchos juegos los pagos son impredecibles. Pero el descubrimiento de von Neumann era una pizca más simple. El descubrió una respuesta única e inequívoca a la pregunta ¿"como puedo aumentar  mis ganancias en este tipo de juegos?" sin mercados, precios, los derechos de propiedad, u otras instituciones en el cuadro. Era una extensión muy importante del concepto de la racionalidad absoluta en la economía neoclásica. Pero von Neumann había comprado su descubrimiento a un  precio. El precio era una fuerte simplificación: la suposición de von Newman aplicado únicamente a juegos de suma cero.

 

Por ejemplo, considerar el juego de los niños de " Monedas pares." En este juego, los dos jugadores acuerdan que uno será "par" y el otro será "impar." Cada uno entonces muestra una moneda. Las monedas se muestran simultáneamente, y cada jugador puede mostrar o una cara o una cruz. Si ambos muestran el mismo lado, entonces "par" gana la moneda de "impar" o si ellos muestran lados diferentes, "impar" gana la moneda de "par". Aquí está la tabla de resultado final para el juego.

 

Tabla 1

 

 

Impar

 

 

Cara

Sello

Par

Cara

1.-1

-1.1

Sello

-1.1

1.-1

 

 

Si nosotros agregamos arriba los resultados finale s en cada celda, encontramos 1-1=0. Este es un "juego de suma cero ."

 

DEFINICION: Juego de suma cero: Si agregamos arriba los triunfos y pérdidas en un juego, tratando las pérdidas como negativas, y encontramos que la suma es cero para cada conjunto de estrategias elegida, entonces el juego es un "juego de suma cero."

 

En términos menos formales, juego de suma cero es un juego en el que un jugador gana igual a las pérdidas del otro jugador. Note que la definición requiere una suma cero para cada conjunto de estrategias. Si hay una de estrategia que la suma difiere de cero, entonces el juego no es de suma cero.

 

Aquí hay otro ejemplo de un juego de suma cero. Es un modelo muy simplificado de competencia de precio. Dos compañías venden agua mineral. Cada compañía tiene un costo fijo de $5000 por período, independientemente si ellos venden cualquier cosa o no. Llame a las compañías Perrier y Apollinaris, simplemente para tomar dos nombres al azar.

 

Las dos compañías compiten para el mismo mercado y cada firma debe escoger un precio alto ($2

la botella) o un precio bajo ($1 la botella). Estas son las reglas del juego:

 

1) A un precio de $2, 5000 botellas pueden venderse para una renta total de $10000. 

 

2) A un precio de $1, 10000 botellas pueden venderse para una renta total de $10000.

 

3) Si ambas compañías cobran el mismo precio, ellos reparten las ventas igualmente entre ellas. 

 

4) Si una de compañía carga un mayor precio, la compañía con el precio inferior vende la cantidad entera y la compañía con el mayor precio no vende nada. 

 

5) Los resultado finales son las ganancias  (renta menos el costo fijo -$ 5000). 

 

Aquí está  la tabla de resultado final para estas dos de compañías

 

Tabla 2

 

 

 

Perrier

 

 

$ 1

$ 2

Apollinaris

$ 1

0.0

5000.-5000

$ 2

-5000.5000

0.0

 

 

 (Averigüe que es un juego de suma cero.) Para un juego de dos personas de suma cero, hay un claro concepto de una solución. La solución al juego es el criterio maximin; que es, cada jugador escoge la estrategia que aumenta al máximo su resultado final mínimo. En este juego, la ganancia de Appolinaris mínima a un precio de $1 es cero, y a un precio de $2 es - 5000, o sea el precio de $1 aumenta al máximo el mínimo resultado final. El mismo razonamiento se aplica a Perrier, o sea que ambos escogen el precio de $1. Este es el razonamiento detrás de la solución maximin: Apollinaris sabe que siempre que ella pierde, Perrier gana; entonces cualquier estrategia que ella escoja, Perrier escogerá la estrategia que de el resultado final mínimo para esa fila. Perrier razona en forma opuesta. 

 

SOLUCION: Criterio maximin:  Para un juego de dos personas de suma cero; es racional que cada jugador a escoja la estrategia que aumenta al máximo el resultado final mínimo, y el par de estrategias y resultados finales tal que cada jugador aumenta al máximo su resultado final mínimo es la "la solución al juego."

 

Estrategias Mixtas

 

Ahora veamos nuevamente al juego de equiparar monedas. Aparece que este juego no tiene una solución única. El resultado final mínimo para cada de las dos  de estrategias es el mismo: - 1. Pero ésta no es la historia entera. Este juego puede tener más de dos estrategias. Además de las dos estrategias obvias, la cabeza y rabo, un jugador puede "aleatorizar" su estrategia por el ofrecimiento o una cabeza o un rabo, al azar, con probabilidades específicas. Tal estrategia aleatorizada se llama una " la estrategia mixta." Las dos estrategias obvias, las cabezas y los rabos, se llaman " las estrategias puras." Hay infinitas estrategias mixtas correspondientes a las infinitas maneras de asignar probabilidades a las dos estrategias puras. 

 

DEFINICION Estrategias mixtas Si un jugador en un juego escoge entre dos o más estrategias al azar según probabilidades específicas, esta elección se llama una " la estrategia mixta."

 

El juego de apareamiento de monedas tiene una solución en estrategias mixtas, y esta puede salir cara o sello al azar con probabilidades 0.5 cada una. Este es el razonamiento: si la oferta impar tiene con cualquier probabilidad mayor de 0.5, entonces par puede tener mejor probabilidades de ganar por ofrecimiento de cara con la probabilidad 1. Por otra parte, si la oferta impar dirige con cualquier probabilidad menor de 0.5, entonces par puede tener mejor probabilidades de ganar por el ofrecimiento sello con la probabilidad 1. La única manera que impar puede conseguir probabili dades ganadoras está en escoger una estrategia aleatorizada con la probabilidad 0.5, y entonces no hay ninguna manera de mejorar las probabilidades. La probabilidad 0.5 aumenta al máximo la ganancia mínima sobre todas las estrategias puras o mixtas. Y par puede razonar de la misma manera (revertiendo caras y sellos) y llega a la misma conclusión, entonces ambos jugadores escogen 0.5.

 

El descubrimiento de Von Neumann

 

Nosotros podemos decir ahora más exactamente lo que el descubrimiento de Von Neumann era. Von Neumann mostró que cada juego de dos personas de suma cero tuvo una solución maximin, en estrategias mixtas y no puras. Limitando su análisis a juegos de dos personas de suma cero, von Neumann había hecho una fuerte simplificación. Von Neumann era un matemático, y él había usado un enfoque del matemático: tome un ejemplo simple, resuélvalo, y entonces trate de extender la solución a los casos más complejos. Pero el enfoque matemático no trabajó también en la teoría de juegos como lo hace en algunos otros casos.

La solución de Von Neumann se aplica inequívocamente sólo a "juegos" que comparten esta propiedad de suma cero.

Por esta suposición, la solución brillante de von Neumann era y es la única aplicable a una  pequeña proporción de "juegos," serios o  no. La carrera armamentista, por ejemplo, no es un juego de suma cero. Ambos participantes pueden, y frecuentemente lo hacen, perder. El Dilema de Los Presos, como hemos notado, no es un juego de suma cero, y es la fuente de una parte importante de su interés. La competencia económica no es un juego de suma cero. Es frecuentemente posible para la mayoría de los jugadores ganar, y en principio, la economía es un juego de triunfo. La contaminación ambiental y la sobre explotación de recursos, nuevamente, tiende a ser un juego de perder: es duro encontrar un ganador en la destrucción de la mayoría del océano del mundo por las pesquerías en la generación pasada. Así, la solución de von Neumann  - - sin el trabajo adicional - -  se aplica a estas interacciones serias.

 

Las interacciones serias son los ejemplos de "los juegos de suma no constante," donde las ganancias y pérdidas se pueden considerar de manera diferente dependiendo de las estrategias que los participantes escogen. Es posible, por ejemplo, para las naciones rivales escoger desarme mutuo, ahorrar el costo de armas, y ambos obtener un mejor resultado - - así la suma de las ganancias es mayor en ese caso. En la competición económica, aumentando la división del trabajo, la especialización, la inversión, y mejorada la coordinación puede aumentar "el tamaño del pastel," conduciendo a "que la opulencia universal se extienda por sí mismo a las clases bajas de la gente," en las palabras de Adam Smith. En los casos de contaminación ambiental, los beneficios al  individuo desde la actividad contaminadora son disminuidos por pérdidas desde la actividad contaminadora  que todos pueden perder - - como hemos observado frecuentemente.

 

El póker y el fútbol son juegos de suma cero. Comienza a parecer que sólo los juegos de suma cero son juegos que los seres humanos han inventado - - y los han hecho de suma cero - - para nuestra propia diversión.

"Los juegos" que en algún sentido natural son juegos de suma no constante. E incluso el fútbol y el póker son casos algo inciertos. Un "amistoso" juego de póker es un juego de suma cero, pero en un juego de casino, la casa toma una proporción del pozo, así la suma de los que ganan es menor que lo que los jugadores apostaron. E incluso en el juego amistoso, nosotros consideramos sólo los resultado finales de dinero - - no la emoción de jugar y el placer del suceso social, sin el que presumiblemente los jugadores no jugarían. Cuando nosotros tomamos esas gratificaciones en  cuenta, los juegos no son realmente de suma cero.

 

Von Neumann y Morgenstern esperaron extender su análisis a juegos de suma no constante con muchos participantes, y ellos propusieron un análisis de estos juegos. Sin embargo, el problema era mucho más difícil, y mientras un número de soluciones se ha propuesto, no hay una solución matemática generalmente aceptada de juegos de suma no constante. Para ponerlo de manera diferente, allí parece no ser clara la respuesta a la pregunta, "Simplemente ¿ qué es racional en un juego de suma no constante?". La bien definida política racional en economía neoclásica - - maximización de las ganancias - - se extiende a juegos de suma cero, pero no a la categoría más realista de juegos de suma no constante.

 

Resumiendo: en un juego de suma cero de dos personas los intereses de los dos competidores son opuestos por que la suma de las ganancias de uno, es exactamente igual a la suma de las pérdidas del otro. Para expresarlo de otro modo la suma del juego es igual a cero.

 

 

 

 

 

 

 

 

 

COMPETIDOR Y

                              ─────────────────────────────────────────

                               ESTRATE-     ESTRATE-    MINIMO DE

                               GIA 3        GIA 4       RENGLONES

───────────────────────────────────────────────────────────────────────

        ┌─

        │ Estrategia 1           + 5          + 7          5

COMPE- 

TIDOR X │ Estrategia 2           + 4          + 6          4

        └─

                                ─────       ──────

          MAXIMO DE

          COLUMNAS                5            7

 

Se supone que los competidores X e Y tienen la misma capacidad e inteligencia. X puede escoger la estrategia 1 o la 2, mientras que Y puede escoger la estrategia 3 o 4. Ambos conocen los posibles resultados de cada estrategia.

 

Hay que hacer notar que el juego favorece al competidor X por que todos los valores son positivos, mientras que los que favorecen a Y serían negativos. Basado en esas condiciones el juego está predispuesto contra Y. Como Y tiene que participar en el juego lo hará para reducir al mínimo sus pérdidas.

 

Todas las estrategias posibles para ambos competidores son las siguientes :

 

1)  X gana el más alto valor del juego si se utiliza todo el tiempo la estrategia 1, por que tiene valores mayores que la estrategia 2.

2)  Y se da cuenta de esa situación y emplea la estrategia 3 a fin de reducir al mínimo sus pérdidas, por que el valor de 5 es menor que el de 7 para la estrategia 4. El valor del juego debe ser 5 por que X gana 5 puntos mientras que Y pierde 5 puntos cada vez que se juega el juego. El "valor del juego" corresponde a las ganancias promedio por juego durante un gran número de jugadas.

 

Ejemplos :       Y

            ┌─       ─┐   No hay punto de silla de montar, porque no

         X  │ -5    4 │   hay pago que sea a la vez el valor más bajo

            │ -4   -8 │   de su renglón y el más alto de su columna.

            └─       ─┘

 

 

                  Y

             ┌─        ─┐

                   ┌─┐ │

               2   │1│ │   Hay punto de silla de montar porque el me-

         X         └─┘ │   nor valor del renglón, es el mayor de la co-

             │ -3   -4     lumna.

                      

             │ -5   -6 

             └─        ─┘

 

En el caso de matrices de pago grandes es conveniente encerrar con un cuadro pequeño el valor más bajo de su renglón y con un cuadro más grande el valor más alto de su columna. Cuando el valor tiene a la vez dos cuadros, entonces habrá un punto de silla de montar.

 

Ejemplo :   ┌─            Y             ─┐

            │ ┌──┐            ┌──┐  ┌─┐ 

            │ │18│   6    2   │16│  │0│ 

            │ └──┘      ┌┬─┬┐ └──┘  └─┘ 

              12   10  ││8││  12   14  

     X        ┌─┐      └┴─┴┘      ┌──┐ 

              │4│   8    6    10  │16│ 

              └─┘ ┌──┐            └┬─┤ 

             10  │12│   4     4   │2│ 

                  └──┘             └─┘ 

            └─                          ─┘

 

DOMINIO

 

Si no existe punto de silla de montar, el paso siguiente consiste en la eliminación de ciertas estrategias (columnas o renglones) por dominio.

El juego resultante puede resolverse mediante alguna estrategia mixta.

 

Ejemplo :    Y

        ┌─      ─┐   El competidor X no jugará el renglón 2 porque esto

          2   6 │   dará a Y su única oportunidad de ganar. El renglón

     X  │ -1  -2 │   2 está  dominado por el renglón 1 o el 3, por que

          3   1 │   esos renglones siempre darán a X un pago mejor que

        └─      ─┘   la estrategia dominada independientemente de las

                     actividades de Y.

 

Regla de dominio para los renglones : Cada valor de renglón dominado debe ser mayor o igual al valor correspondiente del renglón dominado. La matriz resultante es la siguiente:

 

                                    Y

                                ┌─     ─┐

                             X  │ 2   6 │

                                │ 3   1 │

                                └─     ─┘

Otra matriz que se puede reducir por dominio es :

 

           Y

   ┌─              ─┐   El competidor Y tiene más flexibilidad que X

X  │ -4  -6   2   4 │   porque puede jugar cuatro columnas con dos ren

   │ -6  -3   1   2 │   glones de X. Como las columnas 3 y 4 constitu-

   └─              ─┘   yen la única oportunidad de que gane X, Y no ju

                        gará ninguna de ellas, por que esas columnas están dominadas por las columnas 1 y 2.

 

Regla de dominio para las columnas : Todos los valores de las columnas dominadoras deben ser menores que, o iguales al valor correspondiente de la columna dominada. La nueva matriz es esta:

        Y

   ┌─       ─┐

X  │ -4  -6 

   │ -6  -3 

   └─       ─┘

 

ESTRATEGIAS MIXTAS Y VALORES DEL JUEGO (2 x 2)

 

En los casos en que no hay punto de silla de montar y se ha empleado el dominio para reducir el juego a una matriz más pequeña, la competencia empleará una estrategia mixta. Los jugadores "X" e "y" deben determinar la proporción del tiempo en que deben jugar cada renglón (esto sólo se aplica a X) y cada columna (lo que sólo se aplica a Y).

 

Hay tres métodos comunes para encontrar las estrategias óptimas para una matriz de 2 x 2 que son las siguientes : aritmético, algebraico y de álgebra matricial.

 

‑Método aritmético para encontrar estrategias óptimas.

 

El primer paso consiste en restar el pago menor del mayor en cada renglón y ese mismo procedimiento se aplica a la columna.

Por ejemplo: Una compañía y un sindicato negocian el próximo contrato de trabajo. Las estrategias a desarrollar son las siguientes:

Estrategias para la compañía

C1

Se esperan negociaciones muy difíciles con el sindicato

C2

Se considera que las peticiones del sindicato son prácticas

C3

Se considera que las peticiones del sindicato son prácticas

C4

Amplias variaciones en las peticiones del sindicato

Estrategias para el sindicato

S1

Peticiones muy costosas de parte del sindicato

S2

Peticiones muy costosas de parte del sindicato

S3

Peticiones normales de parte del sindicato

S4

Peticiones favorables a la empresa, pero no para el sindicato

 

En base a estas estrategias se preparó la matriz de costos de un aumento condicional de salarios siguiente:

 

 

 

Estrategias de la compañía

 

 

C1

C2

C3

C4

Estrategias

S1

0.25

0.14

0.15

0.32

del

S2

0.40

0.17

0.13

0.16

sindicato

S3

0.30

0.05

0.12

0.15

 

S4

-0.01

0.08

0.11

0.03

Reduciéndola por dominio llegamos a:

         

 ┌─              ─┐

 │ $ 0.14  $ 0.15 │        $ 0.15 - $ 0.14 = $ 0.01

    0.17    0.13 │

 └─              ─┘        $ 0.17 - $ 0.13 = $ 0.04

 

   $ 0.17  $ 0.15

   - 0.14  - 0.13

  ──────── ───────

   $ 0.03  $ 0.02

 

El siguiente paso consiste en intercambiar cada uno de los pares de valores restados.

 

  ┌─              ─┐

  │ $ 0.14  $ 0.15 │     $ 0.04

     0.17    0.13 │

  └─              ─┘     $ 0.01

    $ 0.02  $ 0.03

 

A fin de determinar las estrategias de la compañía súmense $ 0.02 y $ 0.03 y luego colóquese cada uno de ellos sobre su suma. Se sigue el mismo procedimiento para el sindicato, como sigue:

 

       C                         $ 0.04                C

  ┌─       ─┐   ┌─       ─┐   ─────────────     ┌─             ─┐

  │ $ 0.14     $ 0.15      $0.04+$0.01      │ $0.14  $0.15  │ 4/5

 S │   0.17        0.13         $0.01      S    0.17   0.13  │ 1/5

  └─  0.02 ─┘   └─  0.03 ─┘   ─────────────     └─             ─┘

  ────────────  ───────────    $0.04+$0.01          2/5    3/5

   $0.02+$0.03   $0.02+$0.03

 

Esta técnica no puede aplicarse a juegos más grandes.

 

‑Método algebraico para encontrar estrategias óptimas y valores del  juego :

 

El punto de partida del método algebraico consiste en dejar que Q sea igual al tiempo (menor que 1), que el jugador X emplea jugando el primer renglón y (1‑Q), el tiempo que emplea jugando el segundo renglón.

 

Se aplica ese mismo concepto al jugador Y, empleando P. En nuestro ejemplo de la compañía y el sindicato, la representación de la distribución proporcional del tiempo entre las columnas y renglones es la siguiente:

 

               C2         C3

               P          1-P

           ┌─                 ─┐

S1      Q  $ 0.14     $ 0.15 │

S2  1 - Q     0.17       0.13 │

           └─                 ─┘

 

Con este método, el sindicato quiere dividir sus jugadas entre los dos renglones a fin de que las ganancias esperadas de la jugada del primer renglón sean exactamente iguales a las ganancias de la jugada del segundo renglón, a pesar de que lo haga la compañía. A fin de llegar a las estrategias correctas para el sindicato cuando se juegue ya sea el renglón 1 o el 2, es necesario igualar las ganancias esperadas del sindicato  cuando la compañía juega la columna 2 ,con las utilidades esperadas del sindicato cuando la compañía juega la columna 3. Para hacerlo dejemos que $0.14Q + $0.17(1‑Q), sea igual a $0.15Q + $0.13(1‑Q) y resolvemos:

 

   $ 0.14Q + $ 0.17(1-Q)        = $ 0.15Q + $ 0.13(1-Q)

   $ 0.14Q + $ 0.17 - $ 0.17Q = $ 0.15Q + $ 0.13 - $ 0.13Q

                                   $ 0.05 = $ 0.04

                                          Q = 4/5

 

El calculo anterior indica que el sindicato jugará el primer renglón 4/5 partes del tiempo y el segundo renglón 1/5 parte (1‑Q o 1‑4/5=1/5).

 

El mismo enfoque del sindicato se aplica también a la compañía. Las expectaciones de la compañía al jugar su segunda columna P del tiempo y su tercera columna (1‑P) del tiempo, se igualan del modo siguiente : las pérdidas esperadas de la compañía cuando el sindicato juega el renglón 2. En esas condiciones la ecuación es la siguiente:

 

 $ 0.14P + $ 0.15(1‑P)      =  $ 0.17P + $ 0.13(1‑P)

 $ 0.14P + $ 0.15 ‑ 0.15P  =  $ 0.17P + $ 0.13 ‑ $ 0.13P

                                   5P = 2

                                   P = 2/5

 

Esta solución indica que la empresa jugará la columna 2,  2/5 partes del tiempo, y la columna 3  3/5 partes del tiempo (1‑P o 1‑2/5 = 3/5).

 

Valor del juego

 

En todos los casos, una vez halladas las estrategias a jugar, se obtiene el valor del juego, que es la cantidad ganada y perdida por ambos jugadores.

Esta se obtiene de la siguiente manera:

 


PROGRAMACION LINEAL

 

Una estación de servicio "SHELL" está considerando la posibilidad de disminuir los precios, regalando bebidas gaseosas en cada compra de gasolina y aceite de $ 14.00 o regalando un vaso con cada compra de 25 litros. Evidentemente la estación de servicio "ESSO" no puede desconocer la proporción creciente del mercado SHELL y de hecho, la ESSO destinará a aumentar su participación en el mercado.

 

Matriz de pago de (3x3) de dos estaciones de servicio

 

                                         ESTACION ESSO

─────────────────────────────────────────

                            Disminución  Regalo de be-   Regalo de un

                            de precios   bidas gaseosas   vaso en com-

                                         en compras de    pras de 25

                                        $ 14.00          litros a más

─────────────────────────────────────────────────────────────────────

         ┌─

         │ Disminución precios   4 %          1 %             -3 %

        

ESTACION │ Regalo de bebidas

SHELL    │ gaseosas en compras   3            1                6

         de $ 14.00

        

         │ Regalo de un vaso

         en compras de 25     -3            4               -2

         litros o mas

         └─

─────────────────────────────────────────────────────────────────────

 

Las desigualdades que expresan las expectaciones de la estación de servicio ESSO son las siguientes :

 

      4Y1 +  Y2 - 3Y3 <= V

      3Y1 +  Y2 + 6Y3 <= V      ( V = valor del juego )

     -3Y1 + 4Y2 - 2Y3 <= V

       Y1 +  Y2 +  Y3  = 1      ( Tiempo empleado para jugar las 3

                columnas , que se suma a la unidad )

 

      4Y1 +  Y2 - 3Y3

     ────  ────  ──── <= 1      ( Divídase cada lado entre V )

      V      V     V

 

 

 

      3Y1 +  Y2 + 6Y3

     ────  ────  ──── <= 1

      V      V     V

 

     -3Y1 + 4Y2 - 2Y3

     ────  ────  ──── <= 1

      V      V     V

 

 

 

 

A fin de remover las V del dominador, es necesario utilizar una nueva variable (Y'i)

 

           Yi

    Y'i = ────

           V

 

Resolvemos el juego en términos de la Y' , de modo que cuando acabemos, podamos multiplicar la Y' por V, para determinar las Y originales (Yi = Y'i * V). Las nuevas desigualdades son :

 

                4Y'1 +  Y'2 - 3Y'3 <= 1

                3Y'1 +  Y'2 + 6Y'3 <= 1

               -3Y'1 + 4Y'2 - 2Y'3 <= 1

                 Y'1 +  Y'2 +  Y'3 = 1/V

 

Nuestras cuatro restricciones de acuerdo con la anterior son las siguientes:

 

                 Y'1 +  Y'2 +  Y'3  = 1/V

                4Y'1 +  Y'2 - 3Y'3 <= 1

                3Y'1 +  Y'2 + 6Y'3 <= 1

               -3Y'1 + 4Y'2 - 2Y'3 <= 1

 

Podemos expresar las ecuaciones anteriores en términos de un problema de programación lineal, resolviendo la estrategias óptimas de Y, y añadiendo una variable de holgura a cada desigualdad. Hay que recordar que el objetivo de Y consiste en minimizar el valor del juego (V), que es lo mismo que maximizar 1/V.

 

 

 

      Maximizar  Y'1 + Y'2 + Y'3 = 1/V

 

Sujeto a:

                4Y'1 +  Y'2 - 3Y'3 +  S4 + 0S5 + 0S6 = 1

                3Y'1 +  Y'2 + 6Y'3 + 0S4 +  S5 + 0S6 = 1

               -3Y'1 + 4Y'2 - 2Y'3 + 0S4 + 0S5 +  S6 = 1

 

donde S4 , S5 e S6 son variables de holgura.

Las estrategias óptimas de Y' luego de resolver mediante SIMPLEX son :

 

               27                62                 3

        Y'1 = ────   ;    Y'2 = ────   ;      S4 = ────

              161               161                 161

 

Es necesario convertir Y'1,Y'2 e Y'3 en estrategias reales de columna Y lo que puede hacerse multiplicándolas por V. Sin embargo, lo que realmente hemos aumentado al máximo es 1/V. Si 1/V es igual a 4/7 (el valor de la columna de cantidad del último cuadro o Y'1 + Y'2 + Y'3), entonces V es igual a 7/4. Substituyendo 7/4 por V, las estrategias de columna de Y son las siguientes:

 

        Y1 = Y'1 x V       Y2 = Y'2 x V       Y3 = Y'3 x V

 

 

 

 

              27    7            62    7            3     7

        Y1 = ─── x ───     Y2 = ─── x ───     Y3 = ─── x ───

             161    4           161    4           161    4

 

               27                 62                 3

        Y1 = ─────         Y2 = ─────         Y3 = ─────

               92                 92                 92

 

 

Como lo dijimos antes S4 es una variable de holgura y no se jugará .

El procedimiento anterior para calcular las estrategias de Y (así como el valor del juego), puede usarse para X.

 

 

         4X1 + 3X2 - 3X3 >= V        4X1 + 3X2 - 3X3

          X1 +  X2 + 4X3 >= V       ────  ────  ──── >= 1

        -3X1 + 6X2 - 2X3 >= V        V      V     V

          X1 +  X2 +  X3  = 1

       (Las estrategias suman 1)      X1 +  X2 + 4Y3

                                    ────  ────  ──── >= 1

                                     V      V     V

 

                                    -3X1 + 6X2 - 2X3

                                    ────  ────  ──── >= 1

                                     V      V     V

 

                                     X1 +  X2 +  X3     1

                                    ────  ────  ──── = ───

                                     V      V     V     V

 

La definición de una nueva variable X'i, que es igual a X1/V o Xi = X'i x V.

 

                                          1

           Minimizar   X'1 + X'2 + X'3 = ───

                                          V

Sujeto a :

                 4X'1 + 3X'2 - 3X'3 >= 1

                  X'1 +  X'2 + 4X'3 >= 1

                -3X'1 + 6X'2 - 2X'3 >= 1

 

Esas ecuaciones pueden expresarse de nuevo añadiendo variables de holgura y artificiales.

El jugador X quiere aumentar al máximo V, o reducir al mínimo 1/V. Las ecuaciones del problema de programación lineal son:

 

 

 

 

 

 

 

 

                                          1

           Minimizar   X'1 + X'2 + X'3 = ───

                                          V

 

Sujeto a :

 

   4X'1 + 3X'2 - 3X'3 -  S4 + 0S5 + 0S6 + l7 + 0l8 + 0l9 = 1

    X'1 +  X'2 + 4X'3 + 0S4 -  S5 + 0S6 + 0l7 +  l8 + 0l9 = 1

  -3X'1 + 6X'2 - 2X'3 + 0S4 + 0S5 -  S6 + 0l7 + 0l8 +  l9 = 1

 

donde S4, S5 y S6 son variables de holgura y l7, l8 y l9 son variables artificiales.

 

 

El Simplex produce las siguientes estrategias :

 

                 1                    2                    1

         X'1 = ─────     ;    X'2 = ─────     ;    X'3 = ─────

                 7                    7                    7

 

Pero Xi = X'i x V, dan por resultado las siguientes estrategias de renglón para X :

 

                1       7              1

         X1 = ───── x ────  ;  X1 = ─────

                7       4              4

 

                2       7              1

         X2 = ───── x ────  ;  X2 = ─────

                7       4              2

 

                1       7              1

         X3 = ───── x ────  ;  X3 = ─────

                7       4              4

 

 

 

1