INSTITUTO POLITECNICO NACIONAL´ Escuela Superior de F ......A mi querida mam´a, por todo el amor...

INSTITUTO POLITÉCNICO NACIONAL

Escuela Superior de F́ısica y Matemáticas

Teoŕıa de Juegos Matriciales y Aplicaciones

TESIS

QUE PARA OBTENER EL TÍTULO DELICENCIADO EN FÍSICA Y MATEMÁTICAS

PRESENTA:Guillermina Ávila Garćıa.

Director de Tesis:

Prof. Rubén Téllez Sánchez.

México D. F., agosto de 2006

A mi querida mamá, por todo el amor que me ha manifestado siempre, la

paciencia y confianza que deposita en mi, y sobre todo por que me ha mostrado lo

bello de la vida a través de sus dulces palabras y su tierna luz en la mirada.

A mi padre por el apoyo que me ha brindado.

A mis hermanos: Lety, Lúıs, Geovanni, Ricky y Nenita por el amor, cariño,

comprensión y alegŕıa que siempre me demuestran.

A Iván por su infinita paciencia, cariño, amor y comprensión que siempre me

expresa.

A Dios por permitirme ser hija, hermana y compañera de tan excelentes y

maravillosos seres humanos.

Con amor y agradecimiento.

2

Agradecimientos

Al M. en C. Rubén Mancio Toledo, docente de la Escuela Superior de F́ısica y

Matemáticas, amigo y excelente profesor, que me ha brindado todo su apoyo incondi-

cional durante y después del trayecto de la carrera, aśı como su colaboración para la

escritura del presente trabajo.

Al M. en I. Rubén Téllez Sánchez asesor de la presente tésis, por su valioso

apoyo y paciencia para llevar a cabo éste trabajo.

A los integrantes del jurado: M. en C. Rubén Mancio Toledo, Dr. Isidro Romero

Medina, Lic. Francisco Quezada Campo, Lic. Armando Hernández Solis, por su valiosa

colaboración en la revisión y sugerencias de ésta tésis.

A todos los profesores de la Escuela Superior de F́ısica y Matemáticas por

contribuir a mi formación académica.

Agradeciendo infinitamente la atención, apoyo y paciencia recibida.

3

Índice general

Introducción 6

1. Esquema Conceptual y Contexto de la Teoŕıa de Juegos 9

1.1. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2. La importancia de la Teoŕıa de Juegos . . . . . . . . . . . . . . . . . 10

1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos . . . . . . . . . 11

1.4. Aplicación de la Teoŕıa de Juegos . . . . . . . . . . . . . . . . . . . . 13

2. Tipoloǵıas y Fundamentos Matemáticos de la Teoŕıa de Juegos 14

2.1. Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2. Tipos de jugadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3. Juegos de información perfecta . . . . . . . . . . . . . . . . . . . . . 16

2.4. Juegos de suma-cero para 2 oponentes . . . . . . . . . . . . . . . . . 16

3. Metodoloǵıa para la solución de problemas 19

3.1. Estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.2. Estrategias de Seguridad . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3. Estrategias Mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.4. Uso de estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . 23

3.5. Métodos para resolver juegos matriciales . . . . . . . . . . . . . . . . 24

3.6. Técnica de punto de silla de montar . . . . . . . . . . . . . . . . . . . 25

3.7. Técnica de dominación . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.7.1. Reducción de orden de Matrices . . . . . . . . . . . . . . . . . 27

3.8. Método Algebraico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.9. Método Geométrico para los juegos 2× n . . . . . . . . . . . . . . . . 383.10. Solución de juegos 2 x 2 con engaño . . . . . . . . . . . . . . . . . . . 41

4

ÍNDICE GENERAL 5

3.11. Método de subjuegos para encontrar el valor del juego . . . . . . . . . 44

4. Programación Lineal 49

4.1. Teorema del Mı́nimax . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.2. Solución por medio de Programación Lineal . . . . . . . . . . . . . . 51

5. Juegos No Cooperativos 59

5.1. Juegos suma diferente de cero o metajuegos . . . . . . . . . . . . . . 59

Conclusiones 64

Bibliograf́ıa 65

Indice Alfabético 66

Avila Garcia

Introducción

Antecedentes

Los inicios de lo que hoy se conoce como Teoŕıa de Juegos se remontan al año 1759

cuando el economista Quesnay empieza a utilizar modelos primitivos de programación

matemática. Más tarde, otro economista de nombre Walras, hace uso, en 1874, de

técnicas similares. Los modelos lineales de la investigación de operaciones, tienen

como precursores a Jordan en 1873, Minkowsky en 1896 y a Farkas en 1903. La

teoŕıa de juegos se cimentó en 1939 con el matemático von Neuman y el economista

Oskar Morgenstern. No fue sino hasta la Segunda Guerra Mundial cuando la Teoŕıa

de Juegos empezó a tomar auge. Primero se le utilizó en la loǵıstica estratégica para

vencer al enemigo y, más tarde al finalizar la guerra, en la loǵıstica de distribución de

todos los recursos militares de los aliados por todo el mundo. Fue debido precisamente

a este último problema que el doctor George Datzing, el que en 1947, resumiendo el

trabajo de muchos de sus precursores, inventará el método simplex con lo cual dio

inicio a la programación lineal, que hoy en d́ıa se utiliza con mucha frecuencia en la

teoŕıa de juegos.1

Problemática

Los conflictos que se presentan hoy en d́ıa, no sólo es en el sector privado, sino tam-

bién en el sector de los servicios públicos, en contratos, guerras militares, guerras

comerciales, marketing para la competencia de los mercados, negociaciones domésti-

cas, comerciales y colectivas, y en alianzas, tanto en los páıses desarrollados como en

los páıses del tercer mundo, lo cual ha dado lugar a que se aplique la teoŕıa de juegos

constantemente. En México la Teoŕıa de Juegos se utiliza dentro del sector público,

entre otros la Secretaŕıa de Comunicaciones, Partidos Poĺıticos, Bancos, etc.

1veáse [6]

6

Dado a que todos somos agentes económicos, conviene estudiar esta teoŕıa,

a fin de entender qué operaciones teóricas y prácticas podŕıan ofrecernos premios

monetarios más grandes. Debe incluirse en la lista a cualquier otra situación en que

dos o más individuos requieran interactuar a fines de obtener ganancias económicas.

Como el ser humano es un homo economicus tanto como un homo ludicus, él

puede encontrar infinidad de aplicaciones a la Teoŕıa de juegos.

Objetivo

El objetivo principal del presente trabajo es desarrollar la teoŕıa de juegos y sus

aplicaciones en el ámbito laboral y en estrategias tanto militares como de mercadeo.

Hipótesis

La teoŕıa de juegos constituye una herramienta adecuada para resolver racionalmente

situaciones de conflicto.

Presentación

En el Caṕıtulo 1 se hace referencia a un texto bibĺıco, donde se realiza un

análisis de cómo intuitivamente ya se usaba la teoŕıa de juegos y que en la vida

cotidiana estamos estrechamente ligados con la toma de decisiones usando juegos.

En el caṕıtulo 2, se introducen los conceptos básicos de la teoŕıa de juegos

aśı como los tipos de juegos que se tienen; como son: aleatorios, no aleatorios y de

información perfecta, aśı mismo se introduce el concepto de juegos de suma cero y

las valoraciones que se tienen de acuerdo a un juego establecido.

En el caṕıtulo 3, tenemos la parte central del trabajo, pues se define y se explica

a detalle algunas de las metodoloǵıas para la solución a un problema de teoŕıa de

juegos, aśı como las diferentes aplicaciones a las que conducen.

En el caṕıtulo 4, se lleva a cabo una solución mediante programación lineal, un

tema muy importante en el contexto de la teoŕıa de juegos, además de un bosquejo de

la demostración del importante teorema del Minimax aplicable a la teoŕıa de juegos;

haciendo uso de teoremas muy importantes, tales como: Teorema de Dualidad, Teo-

rema de Holgura Complementaria. Todos estos resultados nos conllevan a la solución

de problemas de teoŕıa de juegos por medio de programación lineal.

7

En el caṕıtulo 5, se tiene un breve estudio de los juegos diferente de cero, y se

explica el famoso Dilema del prisionero, y las semejanzas que existe entre éste juego

y las técnicas de mercadeo, en donde d́ıficilmente se conocen las pérdidas o ganancias

que puede tener nuestro oponente.

Finalmente, de acuerdo a la metodoloǵıa empleada en el transcurso de la in-

vestigación nos conlleva a la conclusión y a algunas recomendaciones para el uso de

teoŕıa de juegos.

El presente trabajo se desarrolla por medio de la metodoloǵıa, ilustrando con

ejemplos partiendo desde las técnicas básicas (técnica de punto de silla, dominancia y

geométricos) hasta llegar a el planteamiento y solución de aquellos juegos de m×n, loscuales son imposibles de resolver utilizando técnicas comunes, para ello se implementa

la programación lineal la cual es útil y práctica para resolver estos juegos, haciendo

uso del método simplex.

8

Caṕıtulo 1

Esquema Conceptual y Contexto

de la Teoŕıa de Juegos

1.1. Aportaciones

La Teoŕıa de Juegos es un tipo de análisis matemático orientado a predecir

cuál será el resultado cierto o el resultado más probable de una disputa entre dos

individuos. Fue diseñada y elaborada por el matemático John von Neumann y el

economista Oskar Morgenstern en 1939, con el fin de realizar el análisis económico

de ciertos procesos de negociación. von Neumann y Morgenstern, escribieron el libro

The Theory of Games and Economic Behaviour1 (1944). A.W. Tucker es quien

diseñó el famośısimo problema del “Dilema del Prisionero”. El matemático John

Forbes Nash, Jr. (1928-) creó en 1950 la noción de “Equilibrio Nash”, que corresponde

a una situación en la que dos partes rivales están de acuerdo con determinada situación

del juego o negociación, cuya alteración ofrece desventajas a ambas partes. Otros

importantes representantes de la teoŕıa de juegos fueron el húngaro nacionalizado

estadounidense John Harsanyi (1920-) y el alemán Reinhard Selten, Nash, Harsanyi

y Selten recibieron el Premio Nobel de Economı́a de 1994 por sus contribuciones a la

Teoŕıa de Juegos.

1referencia completa.

9

1.2. La importancia de la Teoŕıa de Juegos 10

1.2. La importancia de la Teoŕıa de Juegos

Un juego es un proceso en que dos o más personas toman decisiones y acciones,

la estructura de las cuales está inscrita en un conjunto de reglas (que pueden ser

formales o informales), a fines de obtener beneficio. Cada combinación de decisiones

y acciones determina una situación particular, y, dado que las decisiones y acciones

de los agentes involucrados (llamados los jugadores) pueden ser combinadas de nu-

merosas formas, las situaciones generadas también serán numerosas y su magnitud

igual a las de las combinaciones de decisiones y acciones de los agentes. El conjun-

to total de situaciones posibles es el cuadro incidental del juego. Siguiendo con este

razonamiento, encontramos que cada situación (es decir, cada punto del cuadro inci-

dental) genera una combinación de premios determinada. El premio que le da a un

jugador una situación particular puede ser comparado con los premios que le ofre-

cen las otras situaciones. Un concepto importante es el de pago. Como se dijo, cada

situación particular ofrece una combinación de premios, de la manera siguiente: si

se trata de dos jugadores, la situación ofrece un premio para el primero y otro para

el segundo. Si se trata de tres jugadores, la situación genera un premio para cada

jugador. Ésta es la lógica de los premios y las situaciones. A cada premio se le llama

pago. La Teoŕıa de juegos nos ayuda a analizar juegos en los que dos o más personas

compiten por un único premio o pago situación o conjunto de situaciones que en lo

adelante se les llamará la solución del juego. La solución del juego se sustenta en que

la conducta de cada jugador llega a engancharse con la de los otros, derivando todo

esto en situaciones más fuertes que otras. Las situaciones más fuertes son las que

se producen con la mayor probabilidad, y debido a esto es que se considera que la

solución o desenlace del problema del juego corresponde a la situación o situaciones

más fuertes, más probables.

El análisis de un juego lleva muchas veces a que se determine cuál va a ser el

punto final de solución de dicho juego a este resultado se le denominará resultado

inminente o fatal del juego. No obstante, en realidad existen muchos juegos cuyo final

es imposible de determinar, incluso con la ayuda de la Teoŕıa de Juegos: estos juegos

no tienen resultados inminentes, o, si es que los tienen, éstos no son previsibles y la

Teoŕıa de Juegos no puede predecirlos. Tal es el caso de un juego de ajedrez, el cual es

un juego de suma cero: todo lo que la Teoŕıa de Juegos nos puede decir acerca de este

juego es que uno de los dos jugadores ganará y el otro perderá el juego. Al margen

Avila Garcia

1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos 11

de esta grave circunstancia, la Teoŕıa de Juegos śı puede ayudarnos a determinar

los resultados de otros muchos importantes juegos y situaciones de negociaciones e

intereses en conflicto. La Teoŕıa de Juegos es importante porque permite hallar los

resultados inminentes o fatales de numerosos juegos diversos que debemos enfrentar

cotidianamente en el mundo real. La Teoŕıa de Juegos no deja de ser importante sólo

porque no puede analizar la totalidad de los juegos que jugamos en el mundo real.

1.3. El sabio rey Salomón hace uso de la Teoŕıa de

Juegos

La Teoŕıa de Juegos es una disciplina que involucra en grado alto la capaci-

dad anaĺıtica y proyectiva del ser humano. Es, a la vez, una disciplina susceptible

de ser aplicada a diversidad de casos. Para mostrar ambas cosas simultáneamente,

se hará mención de la conocida historia de las madres y el rey Salomón. Salomón

recibió a dos mujeres que declaraban ser las madres de un bebé (1 Reyes 3, 16-28)2.

Ante la ausencia de datos o indicios tangibles, deb́ıa creerse bien a una o a la otra,

luego de lo cual el bebé seŕıa entregado a la mujer considerada la madre de éste. De-

mostrando que su gran sabiduŕıa lo relevaba de la necesidad de mayor información,

Salomón elaboró un juego, el cual tomó la forma de una propuesta: “Con esta espada

habrá de partirse al bebé, luego de lo cual se dará una mitad del niño a cada mujer”.

“Inteligentemente”, el sabio rey recurrió a una proposición perfectamente aceptable si

ella era aplicada a juicios sobre materias y objetos comerciales. Este juego exaltaŕıa la

voluntad “competitiva” de obtener ganancia en grado máximo. El truco de Salomón

consist́ıa en que una valoración primordial de competencia rivalizada con la valoración

dictada por el amor maternal. El criterio de optimización individual llevó a una de

las madres a aceptar la peculiar propuesta salomónica. El criterio de amor maternal

llevó a la otra madre a pedir una solución inscrita en la optimización colectiva:

Prefeŕıa que el niño siguiera entero, contentándose con sólo saber que él

segúıa vivo, aún si no pudiera nunca más volver a verlo.

2veáse [5]

Avila Garcia

1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos 12

Salomón observó la siguiente escala de valores:

Primero: Que su hijo exista, que conserve su vida.

Segundo: Tener a su hijo consigo.

Salomón hizo la suposición de que sólo la verdadera madre podŕıa instintiva-

mente conocer y respetar esta escala. Trabajando en base a dicha suposición, las

sometió a una crisis, cuya solución evidente le permitiŕıa acceder a sólo una parte del

premio, o renunciar completamente el premio. Este premio era la tenencia del hijo,

es decir, un pago correspondiente al segundo nivel de la escala de valores.

La falsa madre, por su parte, teńıa la siguiente escala de valores:

Primero: Tener al hijo consigo.

Segundo: Conservar por lo menos una parte del hijo consigo.

Esto, traducido a términos análogos a los de la escala de valores de una verdadera

madre, toma la forma de:

Primero: Tener al hijo consigo.

Segundo: Aunque eso conllevara la pérdida de su vida, conservar una parte del

hijo consigo.

Sin embargo, eso mismo llevado a una escala de valores materiales, equivale a:

Primero: Ganar todo el premio.

Segundo: Ganar al menos una parte del premio.

Es decir que la lógica de la falsa madre era materialista, mientras que la lógica de

la verdadera madre era “lógica de madre”. De hecho, Salomón supusó que la falsa

madre seguiŕıa la lógica materialista que es apropiada para la mayoŕıa de problemas

de obtención de premios, en tanto que la verdadera madre seguiŕıa la lógica de madre.

El problema impuesto por Salomón, de cumplirse las suposiciones de sabio, quitaŕıa

el disfraz de madre a la falsa madre.

Avila Garcia

1.4. Aplicación de la Teoŕıa de Juegos 13

1.4. Aplicación de la Teoŕıa de Juegos

Para usar la Teoŕıa de Juegos como una aplicación para una situación real, se re-

quiere construir modelos simplificados de la realidad. En estos modelos, se tendrá que

representar a cada jugador con sus respectivas formas de conducta. Cuando se trata

de un juego en el que se enfrenta a un único rival, normalmente se puede decir que se

conoce perfectamente cuál es su propia forma de actuar, pero ignora o conoce sólo en

parte la de su rival u oponente. Por esto se hace más fácil representar simplificada-

mente su propia conducta que representar la conducta del rival. En cualquier caso, se

requiere representar adecuadamente las conductas de los dos (o más) jugadores que

intervienen. A veces se necesitaŕıa plantear dos o más representaciones de la conducta

probable del rival. Cada representación recibe el nombre de escenario. Cada escenario

es un juego simple. El conjunto de dos o más escenarios es un juego compuesto.

Avila Garcia

Caṕıtulo 2

Tipoloǵıas y Fundamentos

Matemáticos de la Teoŕıa de

Juegos

2.1. Conceptos

En un juego; puede haber dos o más oponentes; entonces se habla de juegos

para dos personas o, en general, para n personas. Los jugadores en un juego para

n personas pueden formar coaliciones permanentes o temporales durante el curso

del juego; todos los miembros de una coalición permanente se consideran en conjunto

como un jugador, puesto que tienen los mismos intereses. A los juegos de dos personas

también se les llama bipersonales.

Considérense dos jugadores I y II, con intereses opuestos. Por juego, se entiende

un curso de eventos que consisten de una sucesión de acciones por parte de I y II.

Para que el juego sea susceptible de análisis matemático, también debe tenerse un

sistema de reglas establecidas sin ambigüedad, es decir, un sistema de condiciones

que regulen las acciones permisibles para cada jugador en cada etapa del juego, la

cantidad de información que tiene cada bando acerca del comportamiento del otro,

la sucesión de jugadas (es decir, las decisiones que se toman en el curso del juego) y

también el resultado del juego, que se obtiene de la totalidad de las jugadas realizadas

por cada bando.

Se dice que un juego es de suma cero si la suma de las ganancias es cero, es

14

2.2. Tipos de jugadas 15

decir, si uno de los bandos pierde exactamente tanto como lo que el otro gana. En los

juegos de suma cero, las metas que persiguen los jugadores son totalmente opuestas.

La teoŕıa de juegos se divide en cuanto a:

a) Jugadores - Juego de dos personas - Juego de n personas

b) Número de estrategias disponibles a cada decisor - Juegos finitos - Juegos

infinitos

c) Objetivos del juego - Juegos de suma - cero - Juegos suma diferente de cero

o metajuegos.

2.2. Tipos de jugadas

Un juego se realiza mediante jugadas sucesivas; cada jugada es una elección de

una de las alternativas posibles especificadas por las reglas. Una jugada puede ser

personal o aleatoria. Una jugada personal es una elección y ejecución consciente, por

parte de uno de los jugadores, de una de las jugadas que sean posibles en la situación

dada. Un ejemplo de una jugada personal es cualquier jugada en un juego de ajedrez.

Cuando le corresponde su turno, el jugador hace una elección consciente de entre

las jugadas posibles, dependiendo de la posición de las piezas sobre el tablero. El

conjunto de posibilidades disponibles para una jugada personal está determinado por

las reglas del juego y depende de la totalidad de las jugadas previas realizadas por

ambos jugadores. Una jugada aleatoria es la elección de una posibilidad de entre un

cierto número de ellas, no por la decisión de un jugador, sino por el resultado de

algún evento aleatorio (lanzamiento de una moneda, lanzamiento de dados, baraja y

reparto de cartas, etc.). Por ejemplo, si el juego requiere que se extraiga una carta al

azar de una baraja completa, ésta es una jugada aleatoria con 52 resultados posibles,

cada uno con la misma probabilidad. Para que el juego sea matemáticamente deter-

minado, las reglas del juego deben aclarar cuál es la distribución de probabilidad de

los diversos resultados posibles de cada una de las jugadas aleatorias. Algunos juegos

sólo contienen jugadas aleatorias y, con propiedad, se les da el nombre de ”juegos de

azar”. Otros sólo contienen jugadas personales (ajedrez, damas). La mayoŕıa de los

juegos de cartas son mixtos, contienen tanto jugadas personales como aleatorias.

Avila Garcia

2.3. Juegos de información perfecta 16

2.3. Juegos de información perfecta

Los juegos también se clasifican según el tipo y cantidad de la información

disponible -para cada jugador- acerca de las jugadas del oponente. Un juego en el

cual cada participante, al hacer una jugada, conoce los resultados de todas las jugadas

hechas previamente, sean éstas personales o aleatorias, se llama juego de información

perfecta. Ejemplos de tales juegos son el ajedrez, las damas y el juego de tres en raya.

En otros juegos, los jugadores no tienen esa información perfecta; en el póker, por

ejemplo, los jugadores no saben cuáles cartas han recibido sus oponentes.

En la vida real la mayoŕıa de las situaciones antagónicas no son juegos de infor-

mación perfecta, dado que la ignorancia de las acciones del oponente, generalmente,

es un elemento esencial de tales situaciones.

2.4. Juegos de suma-cero para 2 oponentes

Los elementos en la formulación de un juego normal son los siguientes:

1. Un conjunto finito de estrategias puras E1 = {I1, I2, . . . , In}, para el jugador I yun conjunto finito de estrategias puras E2 = {II1, II2, . . . , IIm} para el jugadorII.

2. Una matriz real de orden n×m A = (aij). Cada elemento de esta matriz es elpago para el jugador I cuando elige la estrategia Ii y el jugador II escoge la

estrategia IIj. El pago para el jugador II en estas circunstancias es −aij . Larepresentación de la matriz, es:

Estrategia del jugador de renglones,

jugador I

Estrategia del jugador de columnas,

jugador II

renglón 1

renglón 2...

renglón m

columna 1 columna 2 · · · columna na11 a12 · · · a1na21 a22 · · · a2n...

... · · · ...am1 am2 · · · amn

Una solución de estos juegos especif́ıca las estrategias óptimas que los jugadores

racionales usarán y el pago que se obtiene con ellas. La solución o soluciones de un

Avila Garcia

2.4. Juegos de suma-cero para 2 oponentes 17

juego de 2 personas de suma nula pueden caracterizarse de dos formas: mediante las

estrategias de seguridad y con el concepto de punto de equilibrio.

Ejemplo 1.1 O.G. Haywood (1954)1. En el desembarco aliado, en agosto de

1944, se ha abierto una brecha por mar Avranches (Francia). La cabeza de playa ha

expuesto el flanco oeste del noveno ejército alemán, mandado por el general von Kluge.

Este tiene dos posibles formas de actuar: (1) Atacar hacia al oeste para llegar al mar,

asegurándose su flanco occidental y dividir a las fuerzas americanas. (2) Retirarse

hacia el este para llegar a una mejor posición defensiva cerca del ŕıo Sena. El general

americano Bradley tiene al primer ejército americano conteniendo al ejército alemán

desde la cabeza de playa, y más al interior tiene al tercer ejército, bajo las órdenes del

general Patton, en reserva, haciendo misiones de limpieza del terreno hacia el este,

sur y oeste. Bradley consideró tres posibilidades: (1) Ordenar a la reserva volver a

defender la brecha abierta. (2) Enviar la reserva hacia el este para intentar cortar la

retirada del noveno ejército alemán. (3) Mantener las reservas en su posición durante

un d́ıa y decidir después si ordenar ayudar a la cabeza de playa si era atacada o

enviarlas hacia el este.

El análisis completo de la situación le llevó a valorar los diferentes resultados

de acuerdo con la tabla siguiente, en la que las filas representan las estrategias del

general Bradley, y las columnas las estrategias del general von Kluge.

1. Atacar 2. Retirarse

1. Reforzar Se mantiene la brecha Débil presión sobre la retirada alemana

2. Mover Se produce el corte alemán Fuerte presión en la retirada alemana

3. Esperar Se mantiene la brechay los alemanes son rodeados Moderada presión en la retirada alemana

Lógicamente, la resolución del conflicto dependerá de la valoración de los resul-

tados v (i, j), i = 1, 2, 3 y j = 1, 2. El orden de preferencias de mejor a peor según la

doctrina del ejército americano era:

v (3, 1) > v (2, 2) > v (3, 2) > v (1, 2) > v (2, 1) ,

por lo que al buscar la estrategia menos mala, maximin, el general Bradley escogió la

tercera estrategia. Las valoraciones alemanas deb́ıan ser similares, pues el general von

1veáse [3]

Avila Garcia

2.4. Juegos de suma-cero para 2 oponentes 18

Kluge decidió retirarse, pero nunca ejecutó su decisión. Hitler, a cientos de kilómetros

del campo de batalla, debió tener otras valoraciones del conflicto y ordenó atacar y

cerrar la brecha. El resultado fue que Bradley resistió el ataque alemán; y mantuvo

la reserva en el sur, lo que permitió enviarla el segundo d́ıa hacia el este; los alemanes

comenzaron la retirada, siendo rodeados por las armadas americana y francesa, lo que

llevó al suicidio al general alemán.

Cada jugador puede ordenar las valoraciones y dar valores numéricos a las

consecuencias

v(i, j) (vI(i, j), vII(i, j))

En el caso de que las valoraciones se consideren de forma totalmente opuesta

por los jugadores para uno supone ganancias y para el otro implique pérdidas éstas

pueden expresarse se dice que la situación corresponde a un juego de suma nula.

Cuando esto no ocurre la valoración del juego vendrá dada para cada resultado por dos

números no necesariamente relacionados pues suponen el reflejo de dos valoraciones

independientes llamándose a estos juegos por oposición a los anteriores juegos de

suma no nula.

En otras ocasiones las valoraciones no pueden ordenarse, e incluso valorar las

estrategias pueden tenerse en cuenta diferentes aspectos. En el ejemplo anterior, los

generales pod́ıan valorar los resultados no sólo dependiendo del curso de la guerra

sino también del impacto que se podŕıa producir en la población civil y su entorno.

De hecho muchos modelos se consideran con objetivos escalares debido a la

dificultad de resolver el modelo con objetivos múltiples. Hay situaciones en las que

una misma estrategia debe ser empleada en diferentes escenarios por ejemplo las

poĺıticas de producción de dos empresas que compiten en su mercado pueden valorarse

escalarmente, pero si compiten simultáneamente en varios mercados debe emplearse

la valoración vectorial.

Avila Garcia

Caṕıtulo 3

Metodoloǵıa para la solución de

problemas

3.1. Estrategias

Uno de los conceptos fundamentales de la teoŕıa de juegos es la de estrategias.

Representaremos por Ii, 1 ≤ i ≤ n las estrategias puras del jugador I y por IIj,1 ≤ j ≤ m las estrategias puras del jugador II. El juego permite determinar lavaloración que ocasiona el que cada jugador utilice una de sus estrategias por lo

que representaremos por v (i, j) la valoración de las consecuencias del empleo de la

estrategia Ii por el primer jugador y la estrategia IIj por parte del segundo. Al variar

i y j en sus respectivos campos se tiene una estructura de matriz aunque los valores

no sean números reales por lo que a estos juegos se les denomina juegos matriciales.

Estas valoraciones pueden ser interpretadas de muy diversas formas por los jugadores

que intervienen en el juego.

3.2. Estrategias de Seguridad

En los juegos de suma nula cuando un jugador intenta maximizar su pago a

la vez esta intentando minimizar el pago de su oponente. Cada jugador considera el

peor resultado que puede conseguir con cada una de sus estrategias y después escoge

la estrategia que le proporciona el mejor de los peores resultados.

19

3.2. Estrategias de Seguridad 20

Definición 3.2.1

Para cada estrategia pura Ii ∈ E1, el nivel de seguridad del jugador I es el pagoque puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador II:

vI (Ii) = mı́nj

aij . (3.1)

Para cada estrategia pura IIj ∈ E2 el nivel de seguridad del jugador II es el pago quepuede asegurarse con esa estrategia, prescindiendo de las acciones del jugador I:

vII (IIj) = máxi

aij . (3.2)

Definición 3.2.2

i) El valor maximin (o valor inferior del juego) del jugador I es:

vI = máxi

vi (Ii) = máxi

mı́nj

aij . (3.3)

Una estrategia de seguridad o estrategia maximin es la que proporciona al ju-

gador su valor maximin.

ii) El valor minimax (o valor superior del juego) del jugador II es

vII = mı́nj

vII (IIj) = mı́nj

máxi

aij . (3.4)

Una estrategia de seguridad o estrategia minimax es la que proporciona al ju-

gador su valor minimax.

Teorema 3.2.1

Para cada juego matricial de matriz A = (aij) se tiene:

i) Los valores vI y vII son únicos.

ii) Existe al menos una estrategia de seguridad para cada jugador.

iii) vI ≤ vII .

Avila Garcia

3.3. Estrategias Mixtas 21

Definición 3.2.3

Un juego matricial, de matriz A = (aij) tiene un punto de silla en estrategias

puras cuando se cumple la igualdad:

vI = vII .

Este valor común se llama valor del juego y es el menor elemento de su fila y el

máximo de su columna. Se denota por v.

Observación 3.2.1

Un punto de silla, si existe, es el pago correspondiente a una pareja de estrategias

de seguridad. Dichas estrategias, junto con el valor del juego, constituyen una solución

del juego.

3.3. Estrategias Mixtas

Definición 3.3.1

Una estrategia mixta para un jugador es una distribución de probabilidad en

el conjunto de sus estrategias puras.

En general, si un jugador tiene n estrategias puras, una estrategia mixta para

él es una n-tupla x = (x1, . . . , xn) tal quen∑

i=1

xi = 1, 0 ≤ xi ≤ 1, en donde xi

indica la probabilidad con que el jugador seleccionará su i-ésima estrategia pura. El

conjunto de estrategias mixtas siempre incluye a todas las estrategias puras porque

estas últimas pueden considerarse como un caso especial de estrategia mixta en que

la correspondiente estrategia pura se juega con probabilidad 1 y todas las demás con

probabilidad cero.

Observación 3.3.1

Sea A = (aij), 1 ≤ i ≤ n, 1 ≤ j ≤ m, la matriz de pagos de un juego. Sean X eY los conjuntos de estrategias mixtas de los jugadores I y II respectivamente.

X =

{x ∈ Rn :

n∑i=1

xi = 1, xi ≥ 1, i = 1, . . . , n

}.

Y =

{y ∈ Rm :

m∑j=1

yj = 1, yj ≥ 1, j = 1, . . . ,m

}.

Avila Garcia

3.3. Estrategias Mixtas 22

Para analizar el resultado del juego cuando uno o ambos jugadores utilizan

estrategias mixtas podemos utilizar el concepto de valor esperado. En este caso la

función de pagos del juego es:

v (x, y) =n∑

i=1

m∑j=1

xiaij yj, x ∈ X, y ∈ Y

que es el valor esperado de conseguir los pagos del juego con la combinación de es-

trategias mixtas x ∈ X, y ∈ Y .

Los distintos conceptos estudiados en estrategias puras pueden extenderse al

caso de las estrategias mixtas.

Definición 3.3.2

Para cada estrategia mixta x ∈ X, el nivel de seguridad del jugador I es el valoresperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del

jugador II.

v I (x) = mı́ny∈Y

v (x, y) .

Para cada estrategia mixta y ∈ Y , el nivel de seguridad del jugador II es el valoresperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del

jugador I.

v II (y) = máxx∈X

v (x, y) .

Definición 3.3.3

El valor maximin en estrategias mixtas del jugador I es:

vMI = máxx∈X

mı́ny∈Y

v (x, y) . (3.5)

Una estrategia de seguridad o estrategia maximin es la que proporciona al jugador su

valor maximin.

Definición 3.3.4

El valor mı́nimax en estrategias mixtas del jugador II es:

vMII = mı́ny∈Y

máxx∈X

v (x, y) . (3.6)

Una estrategia de seguridad o estrategia mı́nimax es la que proporciona al jugador su

valor mı́nimax.

Avila Garcia

3.4. Uso de estrategias mixtas 23

Teorema 3.3.1

En un juego matricial de suma nula se tiene:

i) Los valores vMI y vMII son únicos.

ii) Al menos existe una estrategia mixta de seguridad para cada jugador.

iii) Los niveles de seguridad en estrategias puras y mixtas cumplen:

vI ≤ vMI y vMII ≤ vII .

3.4. Uso de estrategias mixtas

Supóngase que nuestra estrategia mixta consta de la aplicación de las estrategias

puras I1, I2, I3 en las razones p1 : p2 : p3, donde las p están normalizadas de modo

que p1 + p2 + p3 = 1; entonces esta estrategia se escribe:

SI =

(I1 I2 I3

p1 p2 p3

).

Análogamente,

SII =

(II1 II2 II3 II4

q1 q2 q3 q4

).

designa una estrategia mixta de nuestro oponente, en la cual se usan las estrategias

puras II1, II2, II3, II4 en la razón q1 : q2 : q3 : q4, donde q1 + q2 + q3 + q4 = 1; esto

significa que II1 se usa una fracción q1 de las partidas, II2 una fracción q2, etc.

Supóngase que se ha encontrado una solución de un juego, que consta de las

dos estrategias mixtas óptimas S∗I y S∗II . En general no todas las estrategias purasdisponibles para un jugador dado se usarán en sus estrategias mixtas óptimas. Aque-

llas estrategias puras que se usan, en esta sección se denominarán “convenientes”.

Resulta que la solución de un juego tiene otra propiedad notable que se probará a

continuación. Si uno de los jugadores se adhiere a su estrategia mixta S∗I (S∗II), en-tonces la ganancia se mantendrá igual al valor del juego, v, sin importar lo que haga

el otro jugador siempre que él sólo use estrategias convenientes. Por tanto, el segundo

jugador puede usar cualesquiera de sus estrategias“convenientes” como una estrategia

pura o puede combinarla en proporciones arbitrarias.

Avila Garcia

3.5. Métodos para resolver juegos matriciales 24

Supóngase que se tiene una solución S∗I , (S∗II) de un juego de mxn. Ahorabien supongamos que la estrategia óptima S∗I es una mezcla de las tres estrategias“convenientes”, I1, I2, I3 y S

∗II es una mezcla de las tres estrategias “convenientes”,

II1, II2, II3:

SI =

(I1 I2 I3

p1 p2 p3

), SII =

(II1 II2 II3

q1 q2 q3

).

donde p1+p2+p3 = 1 y q1+q2+q3+q4 = 1. Nótese que si nos adherimos a la estrategia

S∗I , nuestro oponente puede mezclar las estrategias II1, II2, II3, en proporción quedesee y la ganancia permanecerá inalterada e igual a v, el valor del juego. Sean v1, v2

y v3 las ganancias para las estrategias de nuestro oponente II1, II2 y II3 cuando las

juega contra nuestra estrategia S∗I . De la definición de estrategia óptima se deduceque cualquier desviación de II respecto a su estrategia óptima S∗II no puede aumentarsus ganancias. Esto significa que:

v1 ≥ v, v2 ≥ v, v3 ≥ v. (3.7)

Ahora, bien obsérvese que no pueden cumplirse los signos de desigualdad de la

ecuación (3.7); considérese que v representa v1, v2 y v3 combinadas en las propor-

ciones q1, q2 y q3:

v1q1 + v2q2 + v3q3,

q1 + q2 + q3 = 1(3.8)

A partir de (3.7), se deduce que si cualquiera de los v1, v2, v3 fuera mayor que v, el

segundo miembro de (3.8), también seŕıa mayor que v, lo cual no puede ser cierto.

Por lo tanto:

v1 + v2 = v3 = v

de modo que no importa cómo se combinan v1, v2, v3, su valor promedio será igual a v.

Esta importante propiedad de las estrategias óptimas se usa constantemente cuando

se trata de hallar las soluciones de juegos finitos.

3.5. Métodos para resolver juegos matriciales

La teoŕıa de juegos se ha desarrollado básicamente de acuerdo con el juego

suma-cero para 2 participantes. En cuanto a los métodos que utiliza la teoŕıa de

juegos para alcanzar el objetivo propuesto por los jugadores se tienen:

Avila Garcia

3.6. Técnica de punto de silla de montar 25

♣ Técnica de punto de silla.

♣ Simplificación de Matrices (técnica de dominación).

♣ Método algebraico.

♣ Métodos gráficos.

♣ Método de subjuegos.

♣ Programación Lineal.

♣ Metajuegos.

3.6. Técnica de punto de silla de montar

Ejemplo 3.6.1

Aplicación de un problema con punto de silla:

El general George C. Kenney, comandante de las fuerzas aéreas aliadas del

paćıfico suroriental durante la Segunda Guerra Mundial, utilizó la teoŕıa de juegos

para ganar una de las batallas más importantes en dicha zona.1 Ese conflicto se

conoce como la “batalla del mar de Bismark”.

Este evento histórico ocurrió en los últimos d́ıas de febrero de 1943. Las fuerzas

japonesas agrupadas en Rabaul, Isla de Nueva Inglaterra, pretend́ıan apoderarse de

1Véase [6].

Avila Garcia

3.6. Técnica de punto de silla de montar 26

Lae, Nueva Guinea, que estaba en manos de los aliados. El general Kenney dedujo,

mediante el análisis de ciertos reportes de inteligencia, que los japoneses teńıan sólo

dos estrategias disponibles (figura 1): atacar por la ruta 1 (mar de Coral) o por la

2, (mar de Bismarck). Ambas rutas requeŕıan de 3 d́ıas (aproximadamente 72 horas)

para alcanzar Lae. El general Kenney queŕıa bombardear el convoy japonés antes de

su llegada a Lae. La ruta 2 ofrećıa poca visibilidad; la de la ruta 1 era buena. Su

función objetivo 2 fue la de maximizar el número de horas efectivas de bombardeo del

convoy enemigo.

El general Kenney pensó aśı: 3 “Si concentro un ataque aéreo en la ruta 2 y, en

efecto, los japoneses eligen esa ruta, la búsqueda del convoy será obstaculizada por una

visibilidad pobre y esto se descubrirá hasta el segundo d́ıa, permitiéndonos dos d́ıas

de bombardeo; si, por el contrario, el convoy elige la ruta 1 (mientras yo concentro

mi búsqueda en la 2), una pequeña escuadrilla aérea de reconocimiento descubriŕıa

al convoy después de 1 d́ıa, permitiendo, también, dos d́ıas de bombardeo. Por el

contrario, si concentro el ataque en la ruta 1 y los japoneses eligen esa ruta, serán

descubiertos de inmediato permitiendo 3 d́ıas de bombardeo; en cambio, si eligen la

ruta 2, una pequeña escuadrilla de reconocimiento descubriŕıa al convoy tras 2 d́ıas

de búsqueda, permitiendo un solo d́ıa de bombardeo”.

La decisión del general Kenney se puede traducir a la siguiente matriz de con-

secuencias

Concentracióndel bombardeoaliado

Convoy Japonés

Ruta 1 Ruta 2

3 1

2 2

Dı́as de bombardeo

Ruta 1

Ruta 2

La decisión del general Kenney fue la entrada a22, idéntica a la que seleccionó el

comandante japonés (la entrada a22 es un punto de silla).El resultado de esta decisión

fue una derrota para el ejército japonés, en la épica conocida en la historia bélica como

la ”batalla del mar Bismark”. El nombre se deriva de que tanto el comandante aliado

como el japonés eligieron la ruta 2, la del mar de Bismark. Esta batalla junto con la

2intuitiva.3veáse[6].

Avila Garcia

3.7. Técnica de dominación 27

de Buna y Guadalcanal marcan el inicio de la derrota japonesa en la Segunda Guerra

Mundial [27]. Como vI = vII = 2 entonces existe un punto de silla que es el valor del

juego, es decir; v = 2

3.7. Técnica de dominación

3.7.1. Reducción de orden de Matrices

No en todos los juegos existe punto de silla, para este tipo de juegos se utiliza

la siguiente metodoloǵıa.

Por lo general, es dif́ıcil encontrar una solución, cuando un juego de m× n notiene punto de silla, en especial, si m y n son grandes. A veces puede simplificarse

el problema, reduciendo el número de estrategias en la matriz de ganancias. Las

estrategias que pueden eliminarse de una matriz son:

a) Aquellas que están duplicadas.

b) Aquellas que son dominadas.

Ejemplo 3.7.1

Considérese la siguiente matriz de 4× 4:

II1 II2 II3 II4

I1 1 2 4 3

I2 0 2 3 2

I3 1 2 4 3

I4 4 3 1 0

Primeramente, se hallan las estrategias duplicadas. Obsérvese que las ganancias

para las estrategias I1 y I3 son idénticas, término a término; ninguna de ella es

preferible a la otra y cualquiera podŕıa ser eliminada, en este caso eliminemos I3 .

Ahora se buscan las estrategias dominantes. Cada elemento del renglón I2 es

menor que (o igual a) el elemento correspondiente del renglón I1. Obsérvese que,

nunca debe usarse la estrategia I2, ya que siempre es menos ventajosa que la I1 y, para

Avila Garcia


los propósitos del análisis, también se puede eliminar la I2. Se dice que la estrategia

I1 domina a la estrategia I2 o que la I2 es dominada por la I1.

Después de eliminar las estrategias I2 y I3, queda una matriz más sencilla:

II1 II2 II3 II4

I1 1 2 4 3

I4 4 3 1 0

Además, se nota que, para nuestro oponente, la estrategia II3 es dominada por

la II4, la cual es menor, elemento por elemento. Aśı, la matriz original de 4 × 4 seha reducido a una matriz de 2× 3:

II1 II2 II4

I1 1 2 3

I4 4 3 0

En general, todas las estrategias duplicadas y dominadas deben eliminarse en

esta forma, antes de buscar una solución.

Ejemplo 3.7.2

Aplicación en Técnicas de guerra

El bando I desea destruir un objetivo defendido por el bando II. I tiene dos

aviones y II tiene tres cañones antiaéreos. Cada avión lleva explosivo suficiente para

destruir él solo el objetivo.

Para llegar al objetivo, únicamente existen tres posibles v́ıas de acceso (A, B, C).

II puede emplazar cualquiera de sus cañones antiaéreos en cualquiera de las v́ıas de

aproximación, pero un cañon sólo puede cubrir la v́ıa de acceso en la cual quedó ubi-

cado. Cada cañon sólo puede atacar a uno de los aviones, pero si ataca a un avión

tiene la certeza de derribarlo. El bando I no sabe cómo éstan dispuestos los cañones

y el bando II no sabe que v́ıas de acceso tomarán los aviones. El propósito de II es

evitarlo.

Solución:

Este problema puede representarse en la forma de un juego de 2×3. La gananciaconsiste en la probabilidad de destruir el blanco. Las estrategias posibles de I son:

Avila Garcia


I1 - Enviar cada avión por v́ıas de acceso diferentes;

I2 - Enviar ambos aviones a lo largo de la misma v́ıa de acceso.

Las estrategias de II son:

II1 - Emplazar cada uno de sus cañones para cubrir una v́ıa de acceso diferente;

II2 - Emplazar dos cañones para cubrir una v́ıa de acceso y uno para cubrir

otra diferente;

II3 - Emplazar los tres cañones para cubrir la misma v́ıa de acceso.

..............

..............

...............

...............

............................

............................

................................................................................................................................................

..............

..............

...............

...............

..............

..........

....

..........

....

..............

...............

...............

..............

..............

.............. .............. ............... ............... .............. .............. .............. .............. ......................................................................................

...............

...............

..............

..............objetivo

.

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

.........

........

A

B

C

.

...................................................................................................................................................................

.

....................................

....................................

....................................

....................................

....................................

....................................

..............

.

.......................................................................................................................................................................................................................

A continuación se construirá la matriz del juego.

i) I1II1 (Los aviones vuelan a lo largo de v́ıas de acceso diferentes; cada cañón

cubre una v́ıa diferente). Claramente ningún avión puede llegar al objetivo. La

ganancia será:

a11 = 0

ii) I2II1 (Los aviones vuelan juntos a lo largo de una de las v́ıas; cada cañón cubre

una v́ıa diferente). Aqúı, un avión llegará ileso al objetivo:

a21 = 1

iii) I1II2 (Los aviones vuelan a lo largo de v́ıas diferentes; se tienen dos cañones en

una de las v́ıas y uno en otra; la tercera v́ıa no está defendida). La probabilidad

de que uno de los aviones llegue al objetivo es igual a la probabilidad de que

uno de ellos elija la v́ıa no defendida:

a12 =2

3

Avila Garcia


iv) I2II2 (Los aviones vuelan a lo largo de uno de las v́ıas; dos cañones cubren una

de las v́ıas, el tercer cañón cubre otra y la tercera v́ıa se deja indefensa; esto

significa que, en efecto, sólo una de las v́ıas está cubierta, mientras que dos

quedan indefensas). La probabilidad de que por lo menos un avión pasará es

igual a la probabilidad de que la v́ıa elegida no sea la que está cubierta por los

dos cañones:

a22 =2

3

v) I1II3 (Los aviones vuelan a lo largo de v́ıas diferentes; todos los cañones cubren

la misma v́ıa). Es seguro que uno de los aviones llega hasta el blanco:

a13 = 1

vi) I2II3 (Los aviones vuelan a lo largo de una v́ıa de acceso; todos los cañones

cubren la misma v́ıa) Para que el objetivo sea destruido, los aviones deben

elegir una v́ıa no defendida:

a23 =2

3

La matriz de 2× 3 se muestra aqúı.

II1 II2 II3

I1 023

1

I2 123

23

Es claro, que la estrategia II3 es dominada por la estrategia II2. Por lo tanto,

podemos eliminar II3 y reducir la matriz a un juego de 2× 2. La matriz de 2× 2 semuestra aqúı. Esta matriz tiene un punto de silla: los valores inferior y superior del

juego son los mismos:

v =2

3

II1 II2

I1 023

I2 123

Nótese también que la estrategia I1 es dominada por la estrategia I2. La solución del

juego es que ambos jugadores deben usar estrategias puras, la I2 y la II2. Es decir,el

Avila Garcia

3.8. Método Algebraico 31

jugador I siempre debe enviar ambos aviones juntos, eligiendo al azar la v́ıa de acceso

particular, mientras que el jugador II debe cubrir una v́ıa con dos cañones y otra

con el tercero, también eligiendo al azar las dos v́ıas. Nótese que, en este caso, aun

las estrategias “puras” contienen elecciones que rige al azar. Con estas estrategias

óptimas, la ganancia media siempre será v = 23; es decir, el objetivo será destruido

con una probabilidad de v = 23. Hay un rango cont́ınuo de estrategias mixtas que son

óptimas para I, yendo desde p1 = 0 hasta p1 =13.

3.8. Método Algebraico

Los juegos finitos más sencillos, que siempre pueden resolverse por medio de

métodos elementales, son los juegos de 2× 2 y los de 2× n. Considérese un juego de2× 2 con la matriz que se muestra. Si este juego tiene un punto de silla, la soluciónconsiste de la pareja de estrategias puras que se intersectan en el punto silla.

II1 II2

I1 a11 a12

I2 a21 a22

Supóngase que el juego no tiene punto de silla, de modo que los valores inferior

y superior del juego son desiguales. Se desea hallar nuestra estrategia mixta óptima

S∗i =

(I1 I2

p1 p2

)(3.9)

la cual tiene la propiedad de que no importa lo que haga el oponente (en tanto que

sólo use sus estrategias convenientes) la ganancia promedio será igual a v, el valor del

juego. En un juego de 2× 2 sin punto de silla, ambas estrategias de nuestro oponenteson puras convenientes. En caso contrario, la solución consistiŕıa de estrategias puras,

lo cual significa que tendrá un punto de silla. De aqúı que si nos adherimos a nuestra

estrategia óptima el oponente puede usar cualquiera de sus estrategias puras II1, II2

sin cambiar la ganancia media v. Esto proporciona dos ecuaciones:

a11p1 + a21p 2 = v,

a12p1 + a22p 2 = v,(3.10)

Avila Garcia


Puesto que p1 + p2 = 1, a partir de estas ecuaciones se ve que:

a11p1 + a21 (1− p1) = a12p1 + a22 (1− p1) ,

o bien

p1 =a22 − a21

a11 + a22 − a12 − a21, (3.11)

p2 = 1− p1 (3.12)

El valor v del juego se encuentra substituyendo los valores de p1 y p2 en

cualquiera de las ecuaciones 3.10.

Análogamente se puede aplicar para q1, q2, que nos proporciona dos ecuaciones:

a11q1 + a12q 2 = v,

a21q1 + a22q 2 = v,(3.13)

Puesto que q1 + q2 = 1, a partir de estas ecuaciones se ve que:

a11q1 + a12 (1− q1) = a21q1 + a22 (1− q1) ,

o bien

q1 =a22 − a12

a11 − a12 − a21 + a22, (3.14)

q2 = 1− q1 (3.15)

Por otro lado, también se puede calcular el valor de q1 y q2, conociendo el valor

del juego, digamos:

a11q1 + a12q2 = v.

Puesto que q1 + q2 = 1, se tiene:

q1 =v − a12

a11 + a12, (3.16)

q2 = 1− q1. (3.17)

Avila Garcia


Ejemplo 3.8.1

El grupo de administración de la empresa Pascual, ha recibido el encargo de

preparar una estrategia que pueda seguir la empresa durante las próximas negocia-

ciones. En su experiencia anterior, el grupo ha desarrollado las siguientes estrategias

para la empresa Pascual:

C1 = Se esperan negociaciones muy dif́ıciles con los trabajadores

C2 = Se considera que las peticiones de los trabajadores son prácticas.

C3 = Se considera que las peticiones de los trabajadores son poco prácticas.

C4 = Amplias variaciones en las peticiones de los trabajadores.

De acuerdo con su historia pasada, los trabajadores sugieren las siguientes es-

trategias:

U1 = Peticiones muy costosas de parte de los trabajadores

U2 = Peticiones costosas de parte de los trabajadores

U3 = Peticiones normales de parte de los trabajadores

U4 = Peticiones favorables a la empresa, pero no para los trabajadores

El problema de cuál estrategia debe emplear el grupo de administración de la empresa

Pascual, depende de la estrategia que adopten los trabajadores (que es dif́ıcil conocer).

Sin embargo, con ayuda de la Secretaŕıa del Trabajo y Previsión Social (STPS - de

donde han solicitado apoyo en vista de las perspectivas de unas negociaciones muy

dif́ıciles con los trabajadores, y la posibilidad de una huelga prolongada), el grupo

de administración preparó una tabla de costos de un aumento condicional de salarios

(tabla 1). La STPS indicó que los trabajadores prepararon una tabla semejante, porque

se les ha proporcionado la misma información.

La tabla de costos del aumento condicional de salarios se interpretará como

sigue: si la administración de la empresa Pascual adopta la estrategia C1 y el sindicato

adopta la estrategia U1 el contrato final estipulará que la compañ́ıa concedeŕıa un

aumento de $25.00. Las demás anotaciones de la tabla 1 tienen el mismo significado.

En vista de esas cifras, ¿qué harán los negociadores?.

Avila Garcia


Tabla de costos de un aumento condicional de salarios (matriz de 4× 4)

Estrategias

de lostrabajadores

Estrategias de la esmpresa Pascual

C1 C2 C3 C4

U1 +$25.00 +$14.00 +$15.00 +$32.00

U2 +$40.00 +$17.00 +$13.00 +$16.00

U3 +$30.00 +$5.00 +$12.00 +$15.00

U4 −$1.00 +$8.00 +$11.00 +$3.00

En cualquier problema de la teoŕıa de juegos, el primer paso consiste en hacer

la prueba del punto de silla, que en este caso especial no es aplicable. El siguiente

consiste en examinar la matriz para buscar si hay algún dominio que pueda aplicarse,

y entonces puede preguntarse: ¿por qué deben jugar los trabajadores el renglón U4, ya

que esto daŕıa a la empresa la posibilidad de ganar, o aceptar un aumento menor?. Es

claro, que los trabajadores nunca jugarán el renglón U4, porque pueden obtener mejores

resultados jugando los renglones U1 y U2. Por lo tanto, el renglón U4 está dominado

y se desecha, porque una o más estrategias siempre proporcionarán a los trabajadores

un mejor pago que el de la estrategia dominada, independientemente de lo que haga

la empresa respecto a la regla de renglones, todas las anotaciones de los renglones U1

y U2, son iguales o mayores que la anotación correspondiente del renglón U4, desde

el punto de vista de la S.T.P.S, lo que reduce la matriz original 4 × 4, a la de 3 × 4que se muestra en la siguiente tabla.


Estrategias

de lostrabajadores

Estrategias de la empresa Pascual

C1 C2 C3 C4

U1 +$25.00 +$14.00 +$15.00 +$32.00

U2 +$40.00 +$17.00 +$13.00 +$16.00

U3 +$30.00 +$5.00 +$12.00 +$15.00

Una inspección adicional revela que la columna C4 está dominada por la colum-

na C3, porque la empresa está tratando de reducir al mı́nimo sus pérdidas. Todas las

entradas de la columna C3 son iguales o menores que la anotación correspondiente de

la columna C4, de acuerdo con la regla de columnas. La nueva matriz de 3×3 apareceen la tabla.

Avila Garcia


Tabla 3: Costos de un aumento condicional de salarios (matriz de 3× 3)

Estrategias

de lostrabajadores


C1 C2 C3

U1 +$25.00 +$14.00 +$15.00

U2 +$40.00 +$17.00 +$13.00

U3 +$30.00 +$5.00 +$12.00

La inspección de la tabla 3 revela que el renglón U3 está dominado por el renglón

U2. Los aumentos de salarios del renglón U2 ($40.00, $17.00 y $13.00), son iguales o

mayores que las anotaciones correspondientes del renglón U3 ($30.00, $5.00 y $12.00).

La nueva matriz de 2× 3 aparece en la tabla 4.

Tabla 4: Costos de un aumento condicional de salarios (matriz de 2× 3)

Estrategias

de lostrabajadores


C1 C2 C3

U1 +$25.00 +$14.00 +$15.00

U2 +$40.00 +$17.00 +$13.00

La última oportunidad para aplicar el dominio ocurre en la columna C1. Desde

el punto de vista de la empresa, los aumentos propuestos, que se muestran en la

columna C2 (+$14.00 y +$17.00), son iguales o menores que los de la columna C1

(+$25.00 y +$40.00). La matriz resultante es de 2× 2 (tabla 5). Hay que notar queel procedimiento de dominio puede emplearse para remover más de un renglón o una

columna en el mismo paso.


Estrategias

de lostrabajadores


C2 C3

U1 +$14.00 +$15.00

U2 +$17.00 +$13.00

Avila Garcia


Obsérvese que después de realizar la técnica de dominación, ésta última matriz tam-

poco tiene punto de silla, se aplicará el método algebraico para la solución de este

juego.

Aplicando (3.11), se calcula el valor de p, obtenemos:

p1 =13− 17

14 + 13− 15− 17=

4

5

Por lo tanto

p 2 = 1− p 2 = 1−4

5=

1

5

El cálculo anterior indica que los trabajadores jugarán el primer renglón =45 partes

del tiempo y el segundo renglón =15

Analogamente, aplicando (3.14) y (3.15), se calcula q1 y q2, obteniendo:

q1 =2

5

y

q 2 = 1− q 2 = 1−2

5=

3

5

Luego, podemos encontrar el valor del juego v, haciendo uso de las ecuaciones (3.10).

a11p1 + a21p2 = v

14

(4

5

)+ 17

(1

5

)=

56

5+

17

5=

73

5

El valor del juego es $73

5o bien $14.60, que es el aumento que pueden esperar

los trabajadores. Los trabajadores deben ganar, porque el valor del juego es positi-

vo; si fuera negativo la empresa ganaŕıa. Sin embargo, en la matriz original sólo se

presentó un valor negativo contra 15 positivos.

A continuación se ilustra está técnica para el caso de 2 jugadores, con 2 estrategias

de juego para cada uno e inexistencia de un punto silla.

Ejemplo 3.8.2

Supóngase la siguiente matriz de consecuencias:

II1 II2 Probabilidades

I1 5 35 p1

I2 20 10 p2

Probabilidades q1 q2

Avila Garcia


Solución. Si el jugador I selecciona la estrategia I1, su consecuencia esperada será:

5q1 + 35q2,

mientras que si selecciona la I2, ésta será:

20q1 + 10q2.

Como ambos valores esperados deben ser los mismos, se tiene que:

5q1 + 35q2 = 20q1 + 10q2.

Dado que qi ≤ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:

q1 + q2 = 1.

Las dos ecuaciones anteriores con dos incógnitas generan los valores

q1 = 0.625

q2 = 0.375

Análogamente, si el jugador II selecciona la estrategia II1, su consecuencia esperada

será

5p1 + 20p2,

mientras que si selecciona la II2, ésta será:

35p1 + 10p2

y, como ambas deben ser iguales, se tiene que:

5p1 + 20p2 = 35p1 + 10p2.

Dado que pi ≥ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:

p1 + p2 = 1.

Las dos ecuaciones anteriores con dos incógnitas generan:

p1 = 0.25

p2 = 0.75

Avila Garcia

3.9. Método Geométrico para los juegos 2× n 38

El valor del juego será, entonces:

V = 5 (0.25) + 20 (0.75) = 35 (0.25) + 10 (0.75)

= 5 (0.625) + 35 (0.375) = 20 (0.625) + 10 (0.375)

= 16.25

Nótese que existen cuatro posibilidades diferentes para calcular el mismo valor V .

Lo anterior se interpreta diciendo que las estrategias mixtas para el jugador I son

(0.25, 0.75) y para II (0.625, 0.375). La consecuencia esperada es que I gane 16.25 y

II pierda la misma cantidad.

La técnica anterior se complica cuando cada jugador tiene más de dos estrategias

a elegir. La solución para un caso más general se proporcionará, con técnicas de

programación lineal. Para el caso en que un jugador tiene dos estrategias y el otro m

(m > 2), entonces los métodos gráficos trabajan adecuadamente. Éstos enseguida se

explican.

3.9. Método Geométrico para los juegos 2× n

Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo

menos uno de los jugadores, tiene solamente dos estrategias.

Considérese el siguiente juego 2× n.

II

I

y1 y2 . . . yn

x1

x2 = 1− x1a11 a12 . . . a1n

a21 a22 . . . a2n

Supóngase que este juego no tiene un punto de silla. Puesto que I tiene dos

estrategias, se deduce que x2 = 1− x1; x1 ≥ 0, x2 ≥ 0.Los pagos esperados correspondientes a las estrategias puras de II se muestran

en la siguiente tabla.

Estrategia pura de II Pago esperado de I

1 (a11 − a21)x1 + a212 (a12 − a22) x1 + a22...

n (a1n − a2n) x1 + a2n

Avila Garcia


Esto muestra que el pago promedio de I vaŕıa linealmente con x1. Según el criterio

minimax de juegos de estrategias mixtas, el jugador I debe seleccionar el valor de x1

que maximice sus pagos mı́nimos esperados. Esto se hace mediante el trazo de ĺıneas

rectas como funciones de x1. El siguiente ejemplo ilustra esta técnica.

Considere el siguiente juego (2× 4)

II

I

1 2 3 4

1

2

2 2 3 -1

4 3 2 6

Este juego no tiene un punto de silla. Consecuentemente, los pagos esperados

de I correspondientes a las estrategias puras de II están dados de la siguiente forma.

Estrategia pura de II Pago esperado de I

1 −2x1 + 42 −x1 + 33 x1 + 2

4 −7x1 + 6

Estas cuatro rectas se deben trazar como funciones de x1 como se muestran en la

figura. Gráficamente el maximin ocurre en x∗1 = 12 . Este es el punto de intersección dedos rectas 2, 3 y 4. Consecuentemente, la estrategia óptima de I es (x∗1 = 12 , x

∗2 =

12),

y el valor del juego se obtiene sustituyendo x1 en la ecuación de cualesquiera de las

ĺıneas que pasan por el punto maximin. De aqúı obtenemos,

v∗ =

−12

+ 3 =5

2

1

2+ 2 =

5

2

−712

+ 6 =5

2

A fin de determinar las estrategias óptimas de II se debe observar que 3 rectas

pasan por el punto maximin. Lo cual nos indica que II puede combinar las tres

estrategias.

Avila Garcia


.

.......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .

..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

. .............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

. ............................................. ..............................................

. ............................................. ..............................................

. ............................................. ..............................................

. ............................................. ..............................................

. ............................................. ..............................................

. ............................................. ..............................................

. ............................................. ..............................................

. ............................................. ...............................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

................................

......................

.

................................................................................................

................................................................................................

................................................................................................

................................................................................................

................................................................................................

................................................................................................

....................................................

.

..........................................................................................................................................................................................

..........................................................................................................................................................................................

..........................................................................................................................................................................................

..................................................

.

................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

−2−1

x1 = 0

4

1

23

x1 = 1

1

2

3

4

5

6

Pagopromedio

x∗1 =12

v∗ = 52

?

Maximin

Dos rectas cualesquiera que tengan signos opuestos en sus pendientes definen

una solución óptima alternativa. Por consiguiente, de las tres combinaciones (2, 3),

(2, 4) y (3, 4), la combinación (2, 4) debe excluirse como no óptima.

La primera combinación (2, 3) implica que y∗1 = y∗4 = 0. En consecuencia, y3 = 1−y2y los pagos promedios dde II correspondientes a las estrategias puras I están dadas

como sigue:

Estrategia pura de I Pago esperado de II

1 −y2 + 32 y2 + 2

Por consiguiente,y∗2 (correspondiente al punto minimax) puede determinarse de

−y∗2 + 3 = y∗2 + 2

Esto da por resultado y∗2 = 12 .

Obsérvese que si sustituimos y∗2 =1

2en los pagos esperados de II dados an-

teriormente, el valor minimax es5

2, el que es igual al valor del juego v∗ como es de

esperarse.

La combinación restante (3, 4) puede ser tratada da manera similar para obtener

una solución óptima alternativa. Cualquier promedio ponderado de las combinaciones

(2, 3) y (3, 4) proporcionará también una nueva solución óptima que mezcle las tres

estrategias 2, 3 y 4.

Avila Garcia

3.10. Solución de juegos 2 x 2 con engaño 41

3.10. Solución de juegos 2 x 2 con engaño

Considérese a continuación un juego más complicado, uno cuya solución no es

tan obvia. Es un ejemplo sencillo pero instructivo de juegos que contienen engaño. En

las situaciones antagónicas que se presentan en la vida real, se usan muchos recursos

para engañar al oponente (información falsa, representación falsa de objetivos, etc.).

Ejemplo 3.10.1

Se tienen dos cartas, un as y un dos, con la cara hacia abajo sobre la mesa. El

jugador I levanta una de ellas al azar, sin mostrarla al jugador II. Si la carta es el

as, I debe decir “Tengo el as” y pedir $1.00 a II. Si la carta es el dos, I puede decir:

“Tengo el dos” y pagar $1.00 a II, o bien, “tengo el as” y pedir $1.00 a

II.

Si se le ofrece un peso a II, debe tomarlo. Si se le pide un peso, puede:

a) Creer que I tiene el as y pagarle, o bien,

b) No creerle y exigir que se le muestre la carta. Si pide que se le muestre la carta

y resulta que I tiene en efecto el as, debe pagar $2.00 a I. Si pide que le muestre

la carta y I tiene el dos, I debe pagarle $2.00. A continuación se analiza este

juego para hallar la estrategia óptima para cada bando.

Solución. El juego tiene una estructura relativamente compleja, consiste de

una jugada aleatoria y obligatoria -la elección de una carta por I- y de dos jugadas

personales que pueden hacerse o no. Si I levanta el as, no tiene opción: sólo puede

pedir $1.00 a II. Entonces II tiene una elección personal -creer a I o no creerle, (es

decir, pagarle o pedirle que le muestre la carta). Si en la primera jugada aleatoria

resulta que I levanta el dos, entonces tiene que hacer una elección -engañar o no

engañar. Si I engaña, II tiene nuevamente la misma elección -creerle o no, (es decir,

pagarle o pedir que le muestre la carta); si no engaña, II no tiene más que aceptar

su $1.00.

Las estrategias de los dos jugadores serán las reglas que adopten para determinar

sus jugadas personales.

Claramente I sólo tiene dos estrategias:

• I1 -engañar; I2 -no engañar.

Avila Garcia


II también tiene dos estrategias:

• II1 -creer a I; II2 -pedir que se le muestre la carta.

Para construir la matriz del juego, se necesita calcular el valor medio de la ganancia

para cada una de las combinaciones de estrategias.

1. I1II1 I engaña; II le cree; se calcula la ganancia promedio.

i) Si I extrae el as (la probabilidad de que suceda esto es 12), no tiene jugada

personal; debe pedir $1.00 a II, y éste lo paga; la ganancia para I en pesos

es 1.

ii) Si I extrae el dos (la probabilidad de que suceda esto también es 12), engaña

y pide $1.00 a II, quien lo paga; la ganancia es nuevamente 1.

La ganancia promedio es

a11 =

(1

2

)(1) +

(1

2

)(1) = 1. (3.18)

2. I1II2 I engaña; II pide que se le muestre la carta; hay que calcular a12.

i) Si I extrae el as, no tiene jugada personal; debe pedir $1.00 a II; II pide

que se le muestre la carta y, como consecuencia, debe pagar $2.00 a I (la

ganancia para I en pesos es 2).

ii) Si I extrae el dos, engaña y pide $1.00 a II; II pide que se le muestre la

carta y, como resultado, recibe $2.00 de I (la ganancia de I en pesos es

−2).

La ganancia promedio es

a12 =

(1

2

)(+2) +

(1

2

)(−2) = 0. (3.19)

3. I2II1 I no engaña; II no le reta; calculemos:

i) Si I extrae el as, pide $1.00; II lo paga y la ganancia para I en pesos es 1.

ii) Si I extrae el dos, le paga $1.00 a II y II tiene que aceptarlo (la ganancia

de I en pesos es −1). La ganancia promedio es:

a21 =

(1

2

)(+1) +

(1

2

)(−1) = 0. (3.20)

Avila Garcia


4. I2II2 I no engaña; II le reta; calculemos:

i) Si I extrae el as, pide $1.00; II pide que se le muestre la carta y, como

resultado, debe pagar $2.00 a I (la ganancia en pesos es +2).

ii) Si I extrae el dos, paga $1.00 a I, quien debe aceptarlo (la ganancia es

−1).

La ganancia promedio es:

a22 =

(1

2

)(+2) +

(1

2

)(−1) = 1

2. (3.21)

La matriz del juego se muestra aqúı.

II1 II2

I1 1 0

I2 012

El valor inferior del juego es 0, el valor superior es1

2y el juego no tiene punto de

silla. Por tanto, la solución debe consistir de estrategias mixtas. Aplicando la ecuación

(3.11), se obtiene:

p1 =12

1 + 12

=1

3, p2 =

2

3, S∗I =

(I1 I213

23

).

Es decir, I debe engañar en 13

de las ocasiones y no engañar en 23

de las mismas.

Entonces podemos calcular la ganancia promedio o valor del juego:

v =1

3.

El hecho de que v = 13

> 0 significa que el juego tal y como se presenta no es equitativo

para II. Aplicando su estrategia óptima, I siempre puede estar seguro de obtener una

ganancia promedio de 13. Nótese que aplicando su estrategia más cautelosa (maximin)

(en este caso, tanto I1 como I2 son maximin) I puede garantizarse una ganancia de

0, de modo que según las reglas del juego, al aplicar una estrategia mixta, obtiene

una ventaja sobre II.

Hállese la estrategia óptima para II. Se tiene:

(1) q1 + (0) q2 =1

3; q1 =

1

3, q2 =

2

3.

Avila Garcia

3.11. Método de subjuegos para encontrar el valor del juego 44

de aqúı que:

S∗II =

(II1 II2

13

23

).

Es decir, el jugador II debe creerle al jugador I en 13

de los casos y pedir que le

muestre la carta en 23. Entonces perderá, en promedio, en 1

3de las veces. Si aplica su

estrategia pura minimax II2 (pedir que se le muestre la carta), perdeŕıa en promedio,12

de las veces.

3.11. Método de subjuegos para encontrar el valor

del juego

Este método nos facilita el encontrar el valor del juego para un juego de 2× 2,y muchos juegos más grandes pueden reducirse mediante el dominio a un juego de

2× 2. Sin embargo, esto no incluirá todos los casos, porque esa reducción no siemprepuede hacerse. Por ejemplo, dos ĺıneas aéreas cubren la misma ruta, y ambas tratan

de obtener la mayor porción posible del mercado. Una de las ĺıneas aéreas I, parece

más agresiva, porque su situación financiera es muy sólida y su departamento de

mercadotecnia conoce mejor las condiciones del mercado. La matriz de pagos de la

siguiente tabla muestra las pérdidas y las ganancias mensuales de pasajeros, basadas

en ciertas condiciones del mercado. La matriz se lee de este modo: los valores positivos

favorecen a la ĺınea aérea I, mientras que los negativos favorecen a la ĺınea aérea II.

Tabla de matriz de pagos de 2× 3 de dos ĺıneas áereas

Ĺınea:Aereoméxico(jugador I)

Ĺınea: Mexicana de aviación (jugador II)

A B C

B 300 −25 −50C 150 155 175

A: No hace nada.

B: Anuncia tarifas ordinarias y especiales.

Avila Garcia


C: Anuncia caracteŕısticas especiales (peĺıculas cinematográficas y magńıficos ali-

mentos.

El juego de 2× 3 expresado en la tabla anterior, puede considerarse como tresjuegos de 2× 2.

Subjuego 1:M

A

(300 −25150 155

)columnas 1 y 2.

subjuego 2:M

A

(300 −50150 175

)columnas 1 y 3.

Subjuego 3:M

A

(−25 −50155 175

)columnas 2 y 3.

La ĺınea aérea II, que puede escoger no jugar una de las columnas, está tratando de

determinar la combinación de una estrategia de dos columnas que sea la mejor para

ella. Como se hizó notar anteriormente, el jugador que tenga el mayor número de

columnas o renglones, tiene la mayor flexibilidad, lo que generalmente da por resultado

una estrategia mejor. Sin embargo, en este juego hay cuatro valores positivos contra

dos negativos. A fin de obtener la solución de la mejor estrategia para la ĺınea aérea

II, habrá que resolver las estrategias y valores del juego de los tres subjuegos de 2×2.Nótese que cuando no se juega una columna, se representa con un cero. Después puede

usarse cualquiera de los métodos anteriormente vistos.

Subjuego 1:

M

A

(300 −25150 155

)no se está jugando la tercera columna.

Estrategias:

A =1

66,65

66

M =36

66,30

66, 0.

Avila Garcia


Valor del juego: 152.27

Subjuego 2:

M

A

(300 −50150 175

)no se está jugando la segunda columna.

Estrategias:

A =1

15,14

15

M =9

15, 0,

6

15.

Valor del juego: 160.

Subjuego 3:

M

A

(−25 −50155 175

)no se está jugando la primera columna.

Estrategias:

A = 0, 1

M = 0, 1, 0.

Valor del juego: 155.

De acuerdo con los cálculos precedentes, se escoge el valor positivo más bajo,

en este caso el subjuego 1, porque la ĺınea aérea II tiene más flexibilidad. Aunque

la ĺınea aérea I debe jugar cualquier renglón, la ĺınea aérea II no tiene que jugar

las tres columnas, sino dos solamente. La estrategia de la ĺınea aérea II consiste en

jugar la primera columna del tiempo, y la segunda, del tiempo. La ĺınea aérea II no

utilizará la tercera columna. Puede comprobarse que esta estrategia es la óptima si

se observa detalladamente la matriz original.

La solución (valor del juego de 152.52 en favor de la ĺınea aérea I), indica que

I escoge su estrategia mixta de tal modo que gane (o pierda) lo mismo, independi-

entemente de la selección de la columna de II. Como se expresó anteriormente sobre

la forma de determinar una estrategia mixta, las expectaciones de I al jugar una

Avila Garcia


estrategia mixta (entre sus renglones), son las mismas, independientemente de lo que

juegue II. Esto puede expresarse algebraicamente haciendo que el valor del juego del

subjuego 1, sea igual a la columna que juegue II, lo que se demuestra como sigue:

Las ecuaciones precedentes significan que I espera ganar 152.27 clientes, inde-

pendientemente de la selección de II. El signo ≥ significa que I podŕıa ganar más de152.27 clientes si II escogiera una estrategia incorrecta. Si las estrategias que hemos

encontrado son óptimas, deben satisfacer las tres desigualdades anteriores. Substi-

tuyendo los valores de I1 (1 ) y de I2 ( ), los resultados son los siguientes.

Las tres desigualdades se satisfacen con los valores insertados para las estrate-

gias de I. Sin embargo, cuando II juega la columna 3, I gana más de 152.27 clientes,

porque ésa es una mala estrategia para II, y ésta es la razón de que II no juegue la

columna 3, porque daŕıa a I una ventaja adicional en un juego que la favorece.

Como los requerimientos de las estrategias de I se satisfacen, el paso siguiente

es examinar las estrategias de II, para determinar si son óptimas. II ha sus escogido

estrategias de tal modo que pueda reducir al mismo sus pérdidas, lo que puede ex-

presarse algebraicamente haciendo que el valor del juego del subjuego 1 sea igual a

los renglones que juegue I:

Las desigualdades precedentes significan que II espera perder 152.27 clientes,

independientemente de las selecciones de I. El signo ≤ indica que II puede perdermenos, Si I escoge estrategias incorrectas. De nuevo, si las estrategias que hemos en-

contrado son óptimas, deben satisfacer las dos últimas desigualdades. Si substituimos

los valores de II1 II2 y II3, los resultados son los siguientes.

Columna 1:

300

(1

66

)+ 150

(65

66

)≥ 152.27; 4.54 + 147.73 = 152.27

Columna 2:

−25(

1

66

)+ 155

(65

66

)≥ 152.27; −0.38 + 152.65 = 152.27

Columna 3:

−50(

1

66

)+ 175

(65

66

)≥ 152.27; −0.76 + 172.35 > 152.27

Avila Garcia


Luego,

171.59 > 152.27

Las tres desigualdades se satisfacen con los valores insertados para las estrate-

gias de A. Sin embargo, cuando M juega la columna 3, A gana más de 152.27 clientes,

porque ésa es una mala estrategia para M , y ésta es la razón de que M no juegue la

columna 3, porque daŕıa a A una ventaja adicional en un juego que la favorece.

Avila Garcia

Caṕıtulo 4

Programación Lineal

4.1. Teorema del Mı́nimax

Teorema 4.1.1 (Teorema del Mı́nimax)

En todo juego bipersonal finito de suma cero, existen estrategias óptimas x∗ ∈ X,y∗ ∈ Y para cada jugador y se verifica vMI = vMII = v∗ siendo v∗ el valor del juego.

Demostración. Considérense los siguientes Programas Lineales: Primal y

Dual, respectivamente.

Jugador I Jugador II

Primal Dual

máx−v Min v

a11x1 + · · ·+ am1xm ≥−v a11y1 + · · ·+ a1nyn ≤ v

· · · · · · · · · · · · · · · · · · · · · · · ·

a1nx1 + · · ·+ amnxm ≥−v am1y1 + · · ·+ amnyn ≤ v

x1 + · · ·+ xm = 1 y1 + · · ·+ yn = 1

0 ≤ xi ≤ 1, i = 1, . . . ,m 0 ≤ yj ≤ 1, j = 1, . . . , n

Obsérvese que el nivel de seguridad para una estrategia mixta x̂ ∈ X viene dado por:

vI (x̂) = vII (x̂) = mı́ny∈Y

x̂ tAy,

49

4.1. Teorema del Mı́nimax 50

cuyo valor puede obtenerse por medio del dual, es decir

Máx λ (x̂)

sujeto a ~e λ (x̂) ≤ x̂ tA

x̂ ∈ X, λ (x̂) ∈ R

donde ~e = (1, . . . , 1) t

Las estrategias que proporcionan los mejores nivel

INSTITUTO POLITECNICO NACIONAL´ Escuela Superior de F ......A mi querida mam´a, por todo el amor...

Documents

Transcript of INSTITUTO POLITECNICO NACIONAL´ Escuela Superior de F ......A mi querida mam´a, por todo el amor...