INSTITUTO POLITECNICO NACIONAL´ Escuela Superior de F ......A mi querida mam´a, por todo el amor...
Transcript of INSTITUTO POLITECNICO NACIONAL´ Escuela Superior de F ......A mi querida mam´a, por todo el amor...
-
INSTITUTO POLITÉCNICO NACIONAL
Escuela Superior de F́ısica y Matemáticas
Teoŕıa de Juegos Matriciales y Aplicaciones
TESIS
QUE PARA OBTENER EL TÍTULO DELICENCIADO EN FÍSICA Y MATEMÁTICAS
PRESENTA:Guillermina Ávila Garćıa.
Director de Tesis:
Prof. Rubén Téllez Sánchez.
México D. F., agosto de 2006
-
A mi querida mamá, por todo el amor que me ha manifestado siempre, la
paciencia y confianza que deposita en mi, y sobre todo por que me ha mostrado lo
bello de la vida a través de sus dulces palabras y su tierna luz en la mirada.
A mi padre por el apoyo que me ha brindado.
A mis hermanos: Lety, Lúıs, Geovanni, Ricky y Nenita por el amor, cariño,
comprensión y alegŕıa que siempre me demuestran.
A Iván por su infinita paciencia, cariño, amor y comprensión que siempre me
expresa.
A Dios por permitirme ser hija, hermana y compañera de tan excelentes y
maravillosos seres humanos.
Con amor y agradecimiento.
2
-
Agradecimientos
Al M. en C. Rubén Mancio Toledo, docente de la Escuela Superior de F́ısica y
Matemáticas, amigo y excelente profesor, que me ha brindado todo su apoyo incondi-
cional durante y después del trayecto de la carrera, aśı como su colaboración para la
escritura del presente trabajo.
Al M. en I. Rubén Téllez Sánchez asesor de la presente tésis, por su valioso
apoyo y paciencia para llevar a cabo éste trabajo.
A los integrantes del jurado: M. en C. Rubén Mancio Toledo, Dr. Isidro Romero
Medina, Lic. Francisco Quezada Campo, Lic. Armando Hernández Solis, por su valiosa
colaboración en la revisión y sugerencias de ésta tésis.
A todos los profesores de la Escuela Superior de F́ısica y Matemáticas por
contribuir a mi formación académica.
Agradeciendo infinitamente la atención, apoyo y paciencia recibida.
3
-
Índice general
Introducción 6
1. Esquema Conceptual y Contexto de la Teoŕıa de Juegos 9
1.1. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2. La importancia de la Teoŕıa de Juegos . . . . . . . . . . . . . . . . . 10
1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos . . . . . . . . . 11
1.4. Aplicación de la Teoŕıa de Juegos . . . . . . . . . . . . . . . . . . . . 13
2. Tipoloǵıas y Fundamentos Matemáticos de la Teoŕıa de Juegos 14
2.1. Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2. Tipos de jugadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3. Juegos de información perfecta . . . . . . . . . . . . . . . . . . . . . 16
2.4. Juegos de suma-cero para 2 oponentes . . . . . . . . . . . . . . . . . 16
3. Metodoloǵıa para la solución de problemas 19
3.1. Estrategias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2. Estrategias de Seguridad . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3. Estrategias Mixtas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.4. Uso de estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . 23
3.5. Métodos para resolver juegos matriciales . . . . . . . . . . . . . . . . 24
3.6. Técnica de punto de silla de montar . . . . . . . . . . . . . . . . . . . 25
3.7. Técnica de dominación . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.7.1. Reducción de orden de Matrices . . . . . . . . . . . . . . . . . 27
3.8. Método Algebraico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.9. Método Geométrico para los juegos 2× n . . . . . . . . . . . . . . . . 383.10. Solución de juegos 2 x 2 con engaño . . . . . . . . . . . . . . . . . . . 41
4
-
ÍNDICE GENERAL 5
3.11. Método de subjuegos para encontrar el valor del juego . . . . . . . . . 44
4. Programación Lineal 49
4.1. Teorema del Mı́nimax . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2. Solución por medio de Programación Lineal . . . . . . . . . . . . . . 51
5. Juegos No Cooperativos 59
5.1. Juegos suma diferente de cero o metajuegos . . . . . . . . . . . . . . 59
Conclusiones 64
Bibliograf́ıa 65
Indice Alfabético 66
Avila Garcia
-
Introducción
Antecedentes
Los inicios de lo que hoy se conoce como Teoŕıa de Juegos se remontan al año 1759
cuando el economista Quesnay empieza a utilizar modelos primitivos de programación
matemática. Más tarde, otro economista de nombre Walras, hace uso, en 1874, de
técnicas similares. Los modelos lineales de la investigación de operaciones, tienen
como precursores a Jordan en 1873, Minkowsky en 1896 y a Farkas en 1903. La
teoŕıa de juegos se cimentó en 1939 con el matemático von Neuman y el economista
Oskar Morgenstern. No fue sino hasta la Segunda Guerra Mundial cuando la Teoŕıa
de Juegos empezó a tomar auge. Primero se le utilizó en la loǵıstica estratégica para
vencer al enemigo y, más tarde al finalizar la guerra, en la loǵıstica de distribución de
todos los recursos militares de los aliados por todo el mundo. Fue debido precisamente
a este último problema que el doctor George Datzing, el que en 1947, resumiendo el
trabajo de muchos de sus precursores, inventará el método simplex con lo cual dio
inicio a la programación lineal, que hoy en d́ıa se utiliza con mucha frecuencia en la
teoŕıa de juegos.1
Problemática
Los conflictos que se presentan hoy en d́ıa, no sólo es en el sector privado, sino tam-
bién en el sector de los servicios públicos, en contratos, guerras militares, guerras
comerciales, marketing para la competencia de los mercados, negociaciones domésti-
cas, comerciales y colectivas, y en alianzas, tanto en los páıses desarrollados como en
los páıses del tercer mundo, lo cual ha dado lugar a que se aplique la teoŕıa de juegos
constantemente. En México la Teoŕıa de Juegos se utiliza dentro del sector público,
entre otros la Secretaŕıa de Comunicaciones, Partidos Poĺıticos, Bancos, etc.
1veáse [6]
6
-
Dado a que todos somos agentes económicos, conviene estudiar esta teoŕıa,
a fin de entender qué operaciones teóricas y prácticas podŕıan ofrecernos premios
monetarios más grandes. Debe incluirse en la lista a cualquier otra situación en que
dos o más individuos requieran interactuar a fines de obtener ganancias económicas.
Como el ser humano es un homo economicus tanto como un homo ludicus, él
puede encontrar infinidad de aplicaciones a la Teoŕıa de juegos.
Objetivo
El objetivo principal del presente trabajo es desarrollar la teoŕıa de juegos y sus
aplicaciones en el ámbito laboral y en estrategias tanto militares como de mercadeo.
Hipótesis
La teoŕıa de juegos constituye una herramienta adecuada para resolver racionalmente
situaciones de conflicto.
Presentación
En el Caṕıtulo 1 se hace referencia a un texto bibĺıco, donde se realiza un
análisis de cómo intuitivamente ya se usaba la teoŕıa de juegos y que en la vida
cotidiana estamos estrechamente ligados con la toma de decisiones usando juegos.
En el caṕıtulo 2, se introducen los conceptos básicos de la teoŕıa de juegos
aśı como los tipos de juegos que se tienen; como son: aleatorios, no aleatorios y de
información perfecta, aśı mismo se introduce el concepto de juegos de suma cero y
las valoraciones que se tienen de acuerdo a un juego establecido.
En el caṕıtulo 3, tenemos la parte central del trabajo, pues se define y se explica
a detalle algunas de las metodoloǵıas para la solución a un problema de teoŕıa de
juegos, aśı como las diferentes aplicaciones a las que conducen.
En el caṕıtulo 4, se lleva a cabo una solución mediante programación lineal, un
tema muy importante en el contexto de la teoŕıa de juegos, además de un bosquejo de
la demostración del importante teorema del Minimax aplicable a la teoŕıa de juegos;
haciendo uso de teoremas muy importantes, tales como: Teorema de Dualidad, Teo-
rema de Holgura Complementaria. Todos estos resultados nos conllevan a la solución
de problemas de teoŕıa de juegos por medio de programación lineal.
7
-
En el caṕıtulo 5, se tiene un breve estudio de los juegos diferente de cero, y se
explica el famoso Dilema del prisionero, y las semejanzas que existe entre éste juego
y las técnicas de mercadeo, en donde d́ıficilmente se conocen las pérdidas o ganancias
que puede tener nuestro oponente.
Finalmente, de acuerdo a la metodoloǵıa empleada en el transcurso de la in-
vestigación nos conlleva a la conclusión y a algunas recomendaciones para el uso de
teoŕıa de juegos.
El presente trabajo se desarrolla por medio de la metodoloǵıa, ilustrando con
ejemplos partiendo desde las técnicas básicas (técnica de punto de silla, dominancia y
geométricos) hasta llegar a el planteamiento y solución de aquellos juegos de m×n, loscuales son imposibles de resolver utilizando técnicas comunes, para ello se implementa
la programación lineal la cual es útil y práctica para resolver estos juegos, haciendo
uso del método simplex.
8
-
Caṕıtulo 1
Esquema Conceptual y Contexto
de la Teoŕıa de Juegos
1.1. Aportaciones
La Teoŕıa de Juegos es un tipo de análisis matemático orientado a predecir
cuál será el resultado cierto o el resultado más probable de una disputa entre dos
individuos. Fue diseñada y elaborada por el matemático John von Neumann y el
economista Oskar Morgenstern en 1939, con el fin de realizar el análisis económico
de ciertos procesos de negociación. von Neumann y Morgenstern, escribieron el libro
The Theory of Games and Economic Behaviour1 (1944). A.W. Tucker es quien
diseñó el famośısimo problema del “Dilema del Prisionero”. El matemático John
Forbes Nash, Jr. (1928-) creó en 1950 la noción de “Equilibrio Nash”, que corresponde
a una situación en la que dos partes rivales están de acuerdo con determinada situación
del juego o negociación, cuya alteración ofrece desventajas a ambas partes. Otros
importantes representantes de la teoŕıa de juegos fueron el húngaro nacionalizado
estadounidense John Harsanyi (1920-) y el alemán Reinhard Selten, Nash, Harsanyi
y Selten recibieron el Premio Nobel de Economı́a de 1994 por sus contribuciones a la
Teoŕıa de Juegos.
1referencia completa.
9
-
1.2. La importancia de la Teoŕıa de Juegos 10
1.2. La importancia de la Teoŕıa de Juegos
Un juego es un proceso en que dos o más personas toman decisiones y acciones,
la estructura de las cuales está inscrita en un conjunto de reglas (que pueden ser
formales o informales), a fines de obtener beneficio. Cada combinación de decisiones
y acciones determina una situación particular, y, dado que las decisiones y acciones
de los agentes involucrados (llamados los jugadores) pueden ser combinadas de nu-
merosas formas, las situaciones generadas también serán numerosas y su magnitud
igual a las de las combinaciones de decisiones y acciones de los agentes. El conjun-
to total de situaciones posibles es el cuadro incidental del juego. Siguiendo con este
razonamiento, encontramos que cada situación (es decir, cada punto del cuadro inci-
dental) genera una combinación de premios determinada. El premio que le da a un
jugador una situación particular puede ser comparado con los premios que le ofre-
cen las otras situaciones. Un concepto importante es el de pago. Como se dijo, cada
situación particular ofrece una combinación de premios, de la manera siguiente: si
se trata de dos jugadores, la situación ofrece un premio para el primero y otro para
el segundo. Si se trata de tres jugadores, la situación genera un premio para cada
jugador. Ésta es la lógica de los premios y las situaciones. A cada premio se le llama
pago. La Teoŕıa de juegos nos ayuda a analizar juegos en los que dos o más personas
compiten por un único premio o pago situación o conjunto de situaciones que en lo
adelante se les llamará la solución del juego. La solución del juego se sustenta en que
la conducta de cada jugador llega a engancharse con la de los otros, derivando todo
esto en situaciones más fuertes que otras. Las situaciones más fuertes son las que
se producen con la mayor probabilidad, y debido a esto es que se considera que la
solución o desenlace del problema del juego corresponde a la situación o situaciones
más fuertes, más probables.
El análisis de un juego lleva muchas veces a que se determine cuál va a ser el
punto final de solución de dicho juego a este resultado se le denominará resultado
inminente o fatal del juego. No obstante, en realidad existen muchos juegos cuyo final
es imposible de determinar, incluso con la ayuda de la Teoŕıa de Juegos: estos juegos
no tienen resultados inminentes, o, si es que los tienen, éstos no son previsibles y la
Teoŕıa de Juegos no puede predecirlos. Tal es el caso de un juego de ajedrez, el cual es
un juego de suma cero: todo lo que la Teoŕıa de Juegos nos puede decir acerca de este
juego es que uno de los dos jugadores ganará y el otro perderá el juego. Al margen
Avila Garcia
-
1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos 11
de esta grave circunstancia, la Teoŕıa de Juegos śı puede ayudarnos a determinar
los resultados de otros muchos importantes juegos y situaciones de negociaciones e
intereses en conflicto. La Teoŕıa de Juegos es importante porque permite hallar los
resultados inminentes o fatales de numerosos juegos diversos que debemos enfrentar
cotidianamente en el mundo real. La Teoŕıa de Juegos no deja de ser importante sólo
porque no puede analizar la totalidad de los juegos que jugamos en el mundo real.
1.3. El sabio rey Salomón hace uso de la Teoŕıa de
Juegos
La Teoŕıa de Juegos es una disciplina que involucra en grado alto la capaci-
dad anaĺıtica y proyectiva del ser humano. Es, a la vez, una disciplina susceptible
de ser aplicada a diversidad de casos. Para mostrar ambas cosas simultáneamente,
se hará mención de la conocida historia de las madres y el rey Salomón. Salomón
recibió a dos mujeres que declaraban ser las madres de un bebé (1 Reyes 3, 16-28)2.
Ante la ausencia de datos o indicios tangibles, deb́ıa creerse bien a una o a la otra,
luego de lo cual el bebé seŕıa entregado a la mujer considerada la madre de éste. De-
mostrando que su gran sabiduŕıa lo relevaba de la necesidad de mayor información,
Salomón elaboró un juego, el cual tomó la forma de una propuesta: “Con esta espada
habrá de partirse al bebé, luego de lo cual se dará una mitad del niño a cada mujer”.
“Inteligentemente”, el sabio rey recurrió a una proposición perfectamente aceptable si
ella era aplicada a juicios sobre materias y objetos comerciales. Este juego exaltaŕıa la
voluntad “competitiva” de obtener ganancia en grado máximo. El truco de Salomón
consist́ıa en que una valoración primordial de competencia rivalizada con la valoración
dictada por el amor maternal. El criterio de optimización individual llevó a una de
las madres a aceptar la peculiar propuesta salomónica. El criterio de amor maternal
llevó a la otra madre a pedir una solución inscrita en la optimización colectiva:
Prefeŕıa que el niño siguiera entero, contentándose con sólo saber que él
segúıa vivo, aún si no pudiera nunca más volver a verlo.
2veáse [5]
Avila Garcia
-
1.3. El sabio rey Salomón hace uso de la Teoŕıa de Juegos 12
Salomón observó la siguiente escala de valores:
Primero: Que su hijo exista, que conserve su vida.
Segundo: Tener a su hijo consigo.
Salomón hizo la suposición de que sólo la verdadera madre podŕıa instintiva-
mente conocer y respetar esta escala. Trabajando en base a dicha suposición, las
sometió a una crisis, cuya solución evidente le permitiŕıa acceder a sólo una parte del
premio, o renunciar completamente el premio. Este premio era la tenencia del hijo,
es decir, un pago correspondiente al segundo nivel de la escala de valores.
La falsa madre, por su parte, teńıa la siguiente escala de valores:
Primero: Tener al hijo consigo.
Segundo: Conservar por lo menos una parte del hijo consigo.
Esto, traducido a términos análogos a los de la escala de valores de una verdadera
madre, toma la forma de:
Primero: Tener al hijo consigo.
Segundo: Aunque eso conllevara la pérdida de su vida, conservar una parte del
hijo consigo.
Sin embargo, eso mismo llevado a una escala de valores materiales, equivale a:
Primero: Ganar todo el premio.
Segundo: Ganar al menos una parte del premio.
Es decir que la lógica de la falsa madre era materialista, mientras que la lógica de
la verdadera madre era “lógica de madre”. De hecho, Salomón supusó que la falsa
madre seguiŕıa la lógica materialista que es apropiada para la mayoŕıa de problemas
de obtención de premios, en tanto que la verdadera madre seguiŕıa la lógica de madre.
El problema impuesto por Salomón, de cumplirse las suposiciones de sabio, quitaŕıa
el disfraz de madre a la falsa madre.
Avila Garcia
-
1.4. Aplicación de la Teoŕıa de Juegos 13
1.4. Aplicación de la Teoŕıa de Juegos
Para usar la Teoŕıa de Juegos como una aplicación para una situación real, se re-
quiere construir modelos simplificados de la realidad. En estos modelos, se tendrá que
representar a cada jugador con sus respectivas formas de conducta. Cuando se trata
de un juego en el que se enfrenta a un único rival, normalmente se puede decir que se
conoce perfectamente cuál es su propia forma de actuar, pero ignora o conoce sólo en
parte la de su rival u oponente. Por esto se hace más fácil representar simplificada-
mente su propia conducta que representar la conducta del rival. En cualquier caso, se
requiere representar adecuadamente las conductas de los dos (o más) jugadores que
intervienen. A veces se necesitaŕıa plantear dos o más representaciones de la conducta
probable del rival. Cada representación recibe el nombre de escenario. Cada escenario
es un juego simple. El conjunto de dos o más escenarios es un juego compuesto.
Avila Garcia
-
Caṕıtulo 2
Tipoloǵıas y Fundamentos
Matemáticos de la Teoŕıa de
Juegos
2.1. Conceptos
En un juego; puede haber dos o más oponentes; entonces se habla de juegos
para dos personas o, en general, para n personas. Los jugadores en un juego para
n personas pueden formar coaliciones permanentes o temporales durante el curso
del juego; todos los miembros de una coalición permanente se consideran en conjunto
como un jugador, puesto que tienen los mismos intereses. A los juegos de dos personas
también se les llama bipersonales.
Considérense dos jugadores I y II, con intereses opuestos. Por juego, se entiende
un curso de eventos que consisten de una sucesión de acciones por parte de I y II.
Para que el juego sea susceptible de análisis matemático, también debe tenerse un
sistema de reglas establecidas sin ambigüedad, es decir, un sistema de condiciones
que regulen las acciones permisibles para cada jugador en cada etapa del juego, la
cantidad de información que tiene cada bando acerca del comportamiento del otro,
la sucesión de jugadas (es decir, las decisiones que se toman en el curso del juego) y
también el resultado del juego, que se obtiene de la totalidad de las jugadas realizadas
por cada bando.
Se dice que un juego es de suma cero si la suma de las ganancias es cero, es
14
-
2.2. Tipos de jugadas 15
decir, si uno de los bandos pierde exactamente tanto como lo que el otro gana. En los
juegos de suma cero, las metas que persiguen los jugadores son totalmente opuestas.
La teoŕıa de juegos se divide en cuanto a:
a) Jugadores - Juego de dos personas - Juego de n personas
b) Número de estrategias disponibles a cada decisor - Juegos finitos - Juegos
infinitos
c) Objetivos del juego - Juegos de suma - cero - Juegos suma diferente de cero
o metajuegos.
2.2. Tipos de jugadas
Un juego se realiza mediante jugadas sucesivas; cada jugada es una elección de
una de las alternativas posibles especificadas por las reglas. Una jugada puede ser
personal o aleatoria. Una jugada personal es una elección y ejecución consciente, por
parte de uno de los jugadores, de una de las jugadas que sean posibles en la situación
dada. Un ejemplo de una jugada personal es cualquier jugada en un juego de ajedrez.
Cuando le corresponde su turno, el jugador hace una elección consciente de entre
las jugadas posibles, dependiendo de la posición de las piezas sobre el tablero. El
conjunto de posibilidades disponibles para una jugada personal está determinado por
las reglas del juego y depende de la totalidad de las jugadas previas realizadas por
ambos jugadores. Una jugada aleatoria es la elección de una posibilidad de entre un
cierto número de ellas, no por la decisión de un jugador, sino por el resultado de
algún evento aleatorio (lanzamiento de una moneda, lanzamiento de dados, baraja y
reparto de cartas, etc.). Por ejemplo, si el juego requiere que se extraiga una carta al
azar de una baraja completa, ésta es una jugada aleatoria con 52 resultados posibles,
cada uno con la misma probabilidad. Para que el juego sea matemáticamente deter-
minado, las reglas del juego deben aclarar cuál es la distribución de probabilidad de
los diversos resultados posibles de cada una de las jugadas aleatorias. Algunos juegos
sólo contienen jugadas aleatorias y, con propiedad, se les da el nombre de ”juegos de
azar”. Otros sólo contienen jugadas personales (ajedrez, damas). La mayoŕıa de los
juegos de cartas son mixtos, contienen tanto jugadas personales como aleatorias.
Avila Garcia
-
2.3. Juegos de información perfecta 16
2.3. Juegos de información perfecta
Los juegos también se clasifican según el tipo y cantidad de la información
disponible -para cada jugador- acerca de las jugadas del oponente. Un juego en el
cual cada participante, al hacer una jugada, conoce los resultados de todas las jugadas
hechas previamente, sean éstas personales o aleatorias, se llama juego de información
perfecta. Ejemplos de tales juegos son el ajedrez, las damas y el juego de tres en raya.
En otros juegos, los jugadores no tienen esa información perfecta; en el póker, por
ejemplo, los jugadores no saben cuáles cartas han recibido sus oponentes.
En la vida real la mayoŕıa de las situaciones antagónicas no son juegos de infor-
mación perfecta, dado que la ignorancia de las acciones del oponente, generalmente,
es un elemento esencial de tales situaciones.
2.4. Juegos de suma-cero para 2 oponentes
Los elementos en la formulación de un juego normal son los siguientes:
1. Un conjunto finito de estrategias puras E1 = {I1, I2, . . . , In}, para el jugador I yun conjunto finito de estrategias puras E2 = {II1, II2, . . . , IIm} para el jugadorII.
2. Una matriz real de orden n×m A = (aij). Cada elemento de esta matriz es elpago para el jugador I cuando elige la estrategia Ii y el jugador II escoge la
estrategia IIj. El pago para el jugador II en estas circunstancias es −aij . Larepresentación de la matriz, es:
Estrategia del jugador de renglones,
jugador I
Estrategia del jugador de columnas,
jugador II
renglón 1
renglón 2...
renglón m
columna 1 columna 2 · · · columna na11 a12 · · · a1na21 a22 · · · a2n...
... · · · ...am1 am2 · · · amn
Una solución de estos juegos especif́ıca las estrategias óptimas que los jugadores
racionales usarán y el pago que se obtiene con ellas. La solución o soluciones de un
Avila Garcia
-
2.4. Juegos de suma-cero para 2 oponentes 17
juego de 2 personas de suma nula pueden caracterizarse de dos formas: mediante las
estrategias de seguridad y con el concepto de punto de equilibrio.
Ejemplo 1.1 O.G. Haywood (1954)1. En el desembarco aliado, en agosto de
1944, se ha abierto una brecha por mar Avranches (Francia). La cabeza de playa ha
expuesto el flanco oeste del noveno ejército alemán, mandado por el general von Kluge.
Este tiene dos posibles formas de actuar: (1) Atacar hacia al oeste para llegar al mar,
asegurándose su flanco occidental y dividir a las fuerzas americanas. (2) Retirarse
hacia el este para llegar a una mejor posición defensiva cerca del ŕıo Sena. El general
americano Bradley tiene al primer ejército americano conteniendo al ejército alemán
desde la cabeza de playa, y más al interior tiene al tercer ejército, bajo las órdenes del
general Patton, en reserva, haciendo misiones de limpieza del terreno hacia el este,
sur y oeste. Bradley consideró tres posibilidades: (1) Ordenar a la reserva volver a
defender la brecha abierta. (2) Enviar la reserva hacia el este para intentar cortar la
retirada del noveno ejército alemán. (3) Mantener las reservas en su posición durante
un d́ıa y decidir después si ordenar ayudar a la cabeza de playa si era atacada o
enviarlas hacia el este.
El análisis completo de la situación le llevó a valorar los diferentes resultados
de acuerdo con la tabla siguiente, en la que las filas representan las estrategias del
general Bradley, y las columnas las estrategias del general von Kluge.
1. Atacar 2. Retirarse
1. Reforzar Se mantiene la brecha Débil presión sobre la retirada alemana
2. Mover Se produce el corte alemán Fuerte presión en la retirada alemana
3. Esperar Se mantiene la brechay los alemanes son rodeados Moderada presión en la retirada alemana
Lógicamente, la resolución del conflicto dependerá de la valoración de los resul-
tados v (i, j), i = 1, 2, 3 y j = 1, 2. El orden de preferencias de mejor a peor según la
doctrina del ejército americano era:
v (3, 1) > v (2, 2) > v (3, 2) > v (1, 2) > v (2, 1) ,
por lo que al buscar la estrategia menos mala, maximin, el general Bradley escogió la
tercera estrategia. Las valoraciones alemanas deb́ıan ser similares, pues el general von
1veáse [3]
Avila Garcia
-
2.4. Juegos de suma-cero para 2 oponentes 18
Kluge decidió retirarse, pero nunca ejecutó su decisión. Hitler, a cientos de kilómetros
del campo de batalla, debió tener otras valoraciones del conflicto y ordenó atacar y
cerrar la brecha. El resultado fue que Bradley resistió el ataque alemán; y mantuvo
la reserva en el sur, lo que permitió enviarla el segundo d́ıa hacia el este; los alemanes
comenzaron la retirada, siendo rodeados por las armadas americana y francesa, lo que
llevó al suicidio al general alemán.
Cada jugador puede ordenar las valoraciones y dar valores numéricos a las
consecuencias
v(i, j) (vI(i, j), vII(i, j))
En el caso de que las valoraciones se consideren de forma totalmente opuesta
por los jugadores para uno supone ganancias y para el otro implique pérdidas éstas
pueden expresarse se dice que la situación corresponde a un juego de suma nula.
Cuando esto no ocurre la valoración del juego vendrá dada para cada resultado por dos
números no necesariamente relacionados pues suponen el reflejo de dos valoraciones
independientes llamándose a estos juegos por oposición a los anteriores juegos de
suma no nula.
En otras ocasiones las valoraciones no pueden ordenarse, e incluso valorar las
estrategias pueden tenerse en cuenta diferentes aspectos. En el ejemplo anterior, los
generales pod́ıan valorar los resultados no sólo dependiendo del curso de la guerra
sino también del impacto que se podŕıa producir en la población civil y su entorno.
De hecho muchos modelos se consideran con objetivos escalares debido a la
dificultad de resolver el modelo con objetivos múltiples. Hay situaciones en las que
una misma estrategia debe ser empleada en diferentes escenarios por ejemplo las
poĺıticas de producción de dos empresas que compiten en su mercado pueden valorarse
escalarmente, pero si compiten simultáneamente en varios mercados debe emplearse
la valoración vectorial.
Avila Garcia
-
Caṕıtulo 3
Metodoloǵıa para la solución de
problemas
3.1. Estrategias
Uno de los conceptos fundamentales de la teoŕıa de juegos es la de estrategias.
Representaremos por Ii, 1 ≤ i ≤ n las estrategias puras del jugador I y por IIj,1 ≤ j ≤ m las estrategias puras del jugador II. El juego permite determinar lavaloración que ocasiona el que cada jugador utilice una de sus estrategias por lo
que representaremos por v (i, j) la valoración de las consecuencias del empleo de la
estrategia Ii por el primer jugador y la estrategia IIj por parte del segundo. Al variar
i y j en sus respectivos campos se tiene una estructura de matriz aunque los valores
no sean números reales por lo que a estos juegos se les denomina juegos matriciales.
Estas valoraciones pueden ser interpretadas de muy diversas formas por los jugadores
que intervienen en el juego.
3.2. Estrategias de Seguridad
En los juegos de suma nula cuando un jugador intenta maximizar su pago a
la vez esta intentando minimizar el pago de su oponente. Cada jugador considera el
peor resultado que puede conseguir con cada una de sus estrategias y después escoge
la estrategia que le proporciona el mejor de los peores resultados.
19
-
3.2. Estrategias de Seguridad 20
Definición 3.2.1
Para cada estrategia pura Ii ∈ E1, el nivel de seguridad del jugador I es el pagoque puede asegurarse con esa estrategia, prescindiendo de las acciones del jugador II:
vI (Ii) = mı́nj
aij . (3.1)
Para cada estrategia pura IIj ∈ E2 el nivel de seguridad del jugador II es el pago quepuede asegurarse con esa estrategia, prescindiendo de las acciones del jugador I:
vII (IIj) = máxi
aij . (3.2)
Definición 3.2.2
i) El valor maximin (o valor inferior del juego) del jugador I es:
vI = máxi
vi (Ii) = máxi
mı́nj
aij . (3.3)
Una estrategia de seguridad o estrategia maximin es la que proporciona al ju-
gador su valor maximin.
ii) El valor minimax (o valor superior del juego) del jugador II es
vII = mı́nj
vII (IIj) = mı́nj
máxi
aij . (3.4)
Una estrategia de seguridad o estrategia minimax es la que proporciona al ju-
gador su valor minimax.
Teorema 3.2.1
Para cada juego matricial de matriz A = (aij) se tiene:
i) Los valores vI y vII son únicos.
ii) Existe al menos una estrategia de seguridad para cada jugador.
iii) vI ≤ vII .
Avila Garcia
-
3.3. Estrategias Mixtas 21
Definición 3.2.3
Un juego matricial, de matriz A = (aij) tiene un punto de silla en estrategias
puras cuando se cumple la igualdad:
vI = vII .
Este valor común se llama valor del juego y es el menor elemento de su fila y el
máximo de su columna. Se denota por v.
Observación 3.2.1
Un punto de silla, si existe, es el pago correspondiente a una pareja de estrategias
de seguridad. Dichas estrategias, junto con el valor del juego, constituyen una solución
del juego.
3.3. Estrategias Mixtas
Definición 3.3.1
Una estrategia mixta para un jugador es una distribución de probabilidad en
el conjunto de sus estrategias puras.
En general, si un jugador tiene n estrategias puras, una estrategia mixta para
él es una n-tupla x = (x1, . . . , xn) tal quen∑
i=1
xi = 1, 0 ≤ xi ≤ 1, en donde xi
indica la probabilidad con que el jugador seleccionará su i-ésima estrategia pura. El
conjunto de estrategias mixtas siempre incluye a todas las estrategias puras porque
estas últimas pueden considerarse como un caso especial de estrategia mixta en que
la correspondiente estrategia pura se juega con probabilidad 1 y todas las demás con
probabilidad cero.
Observación 3.3.1
Sea A = (aij), 1 ≤ i ≤ n, 1 ≤ j ≤ m, la matriz de pagos de un juego. Sean X eY los conjuntos de estrategias mixtas de los jugadores I y II respectivamente.
X =
{x ∈ Rn :
n∑i=1
xi = 1, xi ≥ 1, i = 1, . . . , n
}.
Y =
{y ∈ Rm :
m∑j=1
yj = 1, yj ≥ 1, j = 1, . . . ,m
}.
Avila Garcia
-
3.3. Estrategias Mixtas 22
Para analizar el resultado del juego cuando uno o ambos jugadores utilizan
estrategias mixtas podemos utilizar el concepto de valor esperado. En este caso la
función de pagos del juego es:
v (x, y) =n∑
i=1
m∑j=1
xiaij yj, x ∈ X, y ∈ Y
que es el valor esperado de conseguir los pagos del juego con la combinación de es-
trategias mixtas x ∈ X, y ∈ Y .
Los distintos conceptos estudiados en estrategias puras pueden extenderse al
caso de las estrategias mixtas.
Definición 3.3.2
Para cada estrategia mixta x ∈ X, el nivel de seguridad del jugador I es el valoresperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del
jugador II.
v I (x) = mı́ny∈Y
v (x, y) .
Para cada estrategia mixta y ∈ Y , el nivel de seguridad del jugador II es el valoresperado que puede asegurarse con esa estrategia, prescindiendo de las acciones del
jugador I.
v II (y) = máxx∈X
v (x, y) .
Definición 3.3.3
El valor maximin en estrategias mixtas del jugador I es:
vMI = máxx∈X
mı́ny∈Y
v (x, y) . (3.5)
Una estrategia de seguridad o estrategia maximin es la que proporciona al jugador su
valor maximin.
Definición 3.3.4
El valor mı́nimax en estrategias mixtas del jugador II es:
vMII = mı́ny∈Y
máxx∈X
v (x, y) . (3.6)
Una estrategia de seguridad o estrategia mı́nimax es la que proporciona al jugador su
valor mı́nimax.
Avila Garcia
-
3.4. Uso de estrategias mixtas 23
Teorema 3.3.1
En un juego matricial de suma nula se tiene:
i) Los valores vMI y vMII son únicos.
ii) Al menos existe una estrategia mixta de seguridad para cada jugador.
iii) Los niveles de seguridad en estrategias puras y mixtas cumplen:
vI ≤ vMI y vMII ≤ vII .
3.4. Uso de estrategias mixtas
Supóngase que nuestra estrategia mixta consta de la aplicación de las estrategias
puras I1, I2, I3 en las razones p1 : p2 : p3, donde las p están normalizadas de modo
que p1 + p2 + p3 = 1; entonces esta estrategia se escribe:
SI =
(I1 I2 I3
p1 p2 p3
).
Análogamente,
SII =
(II1 II2 II3 II4
q1 q2 q3 q4
).
designa una estrategia mixta de nuestro oponente, en la cual se usan las estrategias
puras II1, II2, II3, II4 en la razón q1 : q2 : q3 : q4, donde q1 + q2 + q3 + q4 = 1; esto
significa que II1 se usa una fracción q1 de las partidas, II2 una fracción q2, etc.
Supóngase que se ha encontrado una solución de un juego, que consta de las
dos estrategias mixtas óptimas S∗I y S∗II . En general no todas las estrategias purasdisponibles para un jugador dado se usarán en sus estrategias mixtas óptimas. Aque-
llas estrategias puras que se usan, en esta sección se denominarán “convenientes”.
Resulta que la solución de un juego tiene otra propiedad notable que se probará a
continuación. Si uno de los jugadores se adhiere a su estrategia mixta S∗I (S∗II), en-tonces la ganancia se mantendrá igual al valor del juego, v, sin importar lo que haga
el otro jugador siempre que él sólo use estrategias convenientes. Por tanto, el segundo
jugador puede usar cualesquiera de sus estrategias“convenientes” como una estrategia
pura o puede combinarla en proporciones arbitrarias.
Avila Garcia
-
3.5. Métodos para resolver juegos matriciales 24
Supóngase que se tiene una solución S∗I , (S∗II) de un juego de mxn. Ahorabien supongamos que la estrategia óptima S∗I es una mezcla de las tres estrategias“convenientes”, I1, I2, I3 y S
∗II es una mezcla de las tres estrategias “convenientes”,
II1, II2, II3:
SI =
(I1 I2 I3
p1 p2 p3
), SII =
(II1 II2 II3
q1 q2 q3
).
donde p1+p2+p3 = 1 y q1+q2+q3+q4 = 1. Nótese que si nos adherimos a la estrategia
S∗I , nuestro oponente puede mezclar las estrategias II1, II2, II3, en proporción quedesee y la ganancia permanecerá inalterada e igual a v, el valor del juego. Sean v1, v2
y v3 las ganancias para las estrategias de nuestro oponente II1, II2 y II3 cuando las
juega contra nuestra estrategia S∗I . De la definición de estrategia óptima se deduceque cualquier desviación de II respecto a su estrategia óptima S∗II no puede aumentarsus ganancias. Esto significa que:
v1 ≥ v, v2 ≥ v, v3 ≥ v. (3.7)
Ahora, bien obsérvese que no pueden cumplirse los signos de desigualdad de la
ecuación (3.7); considérese que v representa v1, v2 y v3 combinadas en las propor-
ciones q1, q2 y q3:
v1q1 + v2q2 + v3q3,
q1 + q2 + q3 = 1(3.8)
A partir de (3.7), se deduce que si cualquiera de los v1, v2, v3 fuera mayor que v, el
segundo miembro de (3.8), también seŕıa mayor que v, lo cual no puede ser cierto.
Por lo tanto:
v1 + v2 = v3 = v
de modo que no importa cómo se combinan v1, v2, v3, su valor promedio será igual a v.
Esta importante propiedad de las estrategias óptimas se usa constantemente cuando
se trata de hallar las soluciones de juegos finitos.
3.5. Métodos para resolver juegos matriciales
La teoŕıa de juegos se ha desarrollado básicamente de acuerdo con el juego
suma-cero para 2 participantes. En cuanto a los métodos que utiliza la teoŕıa de
juegos para alcanzar el objetivo propuesto por los jugadores se tienen:
Avila Garcia
-
3.6. Técnica de punto de silla de montar 25
♣ Técnica de punto de silla.
♣ Simplificación de Matrices (técnica de dominación).
♣ Método algebraico.
♣ Métodos gráficos.
♣ Método de subjuegos.
♣ Programación Lineal.
♣ Metajuegos.
3.6. Técnica de punto de silla de montar
Ejemplo 3.6.1
Aplicación de un problema con punto de silla:
El general George C. Kenney, comandante de las fuerzas aéreas aliadas del
paćıfico suroriental durante la Segunda Guerra Mundial, utilizó la teoŕıa de juegos
para ganar una de las batallas más importantes en dicha zona.1 Ese conflicto se
conoce como la “batalla del mar de Bismark”.
Este evento histórico ocurrió en los últimos d́ıas de febrero de 1943. Las fuerzas
japonesas agrupadas en Rabaul, Isla de Nueva Inglaterra, pretend́ıan apoderarse de
1Véase [6].
Avila Garcia
-
3.6. Técnica de punto de silla de montar 26
Lae, Nueva Guinea, que estaba en manos de los aliados. El general Kenney dedujo,
mediante el análisis de ciertos reportes de inteligencia, que los japoneses teńıan sólo
dos estrategias disponibles (figura 1): atacar por la ruta 1 (mar de Coral) o por la
2, (mar de Bismarck). Ambas rutas requeŕıan de 3 d́ıas (aproximadamente 72 horas)
para alcanzar Lae. El general Kenney queŕıa bombardear el convoy japonés antes de
su llegada a Lae. La ruta 2 ofrećıa poca visibilidad; la de la ruta 1 era buena. Su
función objetivo 2 fue la de maximizar el número de horas efectivas de bombardeo del
convoy enemigo.
El general Kenney pensó aśı: 3 “Si concentro un ataque aéreo en la ruta 2 y, en
efecto, los japoneses eligen esa ruta, la búsqueda del convoy será obstaculizada por una
visibilidad pobre y esto se descubrirá hasta el segundo d́ıa, permitiéndonos dos d́ıas
de bombardeo; si, por el contrario, el convoy elige la ruta 1 (mientras yo concentro
mi búsqueda en la 2), una pequeña escuadrilla aérea de reconocimiento descubriŕıa
al convoy después de 1 d́ıa, permitiendo, también, dos d́ıas de bombardeo. Por el
contrario, si concentro el ataque en la ruta 1 y los japoneses eligen esa ruta, serán
descubiertos de inmediato permitiendo 3 d́ıas de bombardeo; en cambio, si eligen la
ruta 2, una pequeña escuadrilla de reconocimiento descubriŕıa al convoy tras 2 d́ıas
de búsqueda, permitiendo un solo d́ıa de bombardeo”.
La decisión del general Kenney se puede traducir a la siguiente matriz de con-
secuencias
Concentracióndel bombardeoaliado
Convoy Japonés
Ruta 1 Ruta 2
3 1
2 2
Dı́as de bombardeo
Ruta 1
Ruta 2
La decisión del general Kenney fue la entrada a22, idéntica a la que seleccionó el
comandante japonés (la entrada a22 es un punto de silla).El resultado de esta decisión
fue una derrota para el ejército japonés, en la épica conocida en la historia bélica como
la ”batalla del mar Bismark”. El nombre se deriva de que tanto el comandante aliado
como el japonés eligieron la ruta 2, la del mar de Bismark. Esta batalla junto con la
2intuitiva.3veáse[6].
Avila Garcia
-
3.7. Técnica de dominación 27
de Buna y Guadalcanal marcan el inicio de la derrota japonesa en la Segunda Guerra
Mundial [27]. Como vI = vII = 2 entonces existe un punto de silla que es el valor del
juego, es decir; v = 2
3.7. Técnica de dominación
3.7.1. Reducción de orden de Matrices
No en todos los juegos existe punto de silla, para este tipo de juegos se utiliza
la siguiente metodoloǵıa.
Por lo general, es dif́ıcil encontrar una solución, cuando un juego de m× n notiene punto de silla, en especial, si m y n son grandes. A veces puede simplificarse
el problema, reduciendo el número de estrategias en la matriz de ganancias. Las
estrategias que pueden eliminarse de una matriz son:
a) Aquellas que están duplicadas.
b) Aquellas que son dominadas.
Ejemplo 3.7.1
Considérese la siguiente matriz de 4× 4:
II1 II2 II3 II4
I1 1 2 4 3
I2 0 2 3 2
I3 1 2 4 3
I4 4 3 1 0
Primeramente, se hallan las estrategias duplicadas. Obsérvese que las ganancias
para las estrategias I1 y I3 son idénticas, término a término; ninguna de ella es
preferible a la otra y cualquiera podŕıa ser eliminada, en este caso eliminemos I3 .
Ahora se buscan las estrategias dominantes. Cada elemento del renglón I2 es
menor que (o igual a) el elemento correspondiente del renglón I1. Obsérvese que,
nunca debe usarse la estrategia I2, ya que siempre es menos ventajosa que la I1 y, para
Avila Garcia
-
3.7. Técnica de dominación 28
los propósitos del análisis, también se puede eliminar la I2. Se dice que la estrategia
I1 domina a la estrategia I2 o que la I2 es dominada por la I1.
Después de eliminar las estrategias I2 y I3, queda una matriz más sencilla:
II1 II2 II3 II4
I1 1 2 4 3
I4 4 3 1 0
Además, se nota que, para nuestro oponente, la estrategia II3 es dominada por
la II4, la cual es menor, elemento por elemento. Aśı, la matriz original de 4 × 4 seha reducido a una matriz de 2× 3:
II1 II2 II4
I1 1 2 3
I4 4 3 0
En general, todas las estrategias duplicadas y dominadas deben eliminarse en
esta forma, antes de buscar una solución.
Ejemplo 3.7.2
Aplicación en Técnicas de guerra
El bando I desea destruir un objetivo defendido por el bando II. I tiene dos
aviones y II tiene tres cañones antiaéreos. Cada avión lleva explosivo suficiente para
destruir él solo el objetivo.
Para llegar al objetivo, únicamente existen tres posibles v́ıas de acceso (A, B, C).
II puede emplazar cualquiera de sus cañones antiaéreos en cualquiera de las v́ıas de
aproximación, pero un cañon sólo puede cubrir la v́ıa de acceso en la cual quedó ubi-
cado. Cada cañon sólo puede atacar a uno de los aviones, pero si ataca a un avión
tiene la certeza de derribarlo. El bando I no sabe cómo éstan dispuestos los cañones
y el bando II no sabe que v́ıas de acceso tomarán los aviones. El propósito de II es
evitarlo.
Solución:
Este problema puede representarse en la forma de un juego de 2×3. La gananciaconsiste en la probabilidad de destruir el blanco. Las estrategias posibles de I son:
Avila Garcia
-
3.7. Técnica de dominación 29
I1 - Enviar cada avión por v́ıas de acceso diferentes;
I2 - Enviar ambos aviones a lo largo de la misma v́ıa de acceso.
Las estrategias de II son:
II1 - Emplazar cada uno de sus cañones para cubrir una v́ıa de acceso diferente;
II2 - Emplazar dos cañones para cubrir una v́ıa de acceso y uno para cubrir
otra diferente;
II3 - Emplazar los tres cañones para cubrir la misma v́ıa de acceso.
..............
..............
...............
...............
............................
............................
................................................................................................................................................
..............
..............
...............
...............
..............
..........
....
..........
....
..............
...............
...............
..............
..............
.............. .............. ............... ............... .............. .............. .............. .............. ......................................................................................
...............
...............
..............
..............objetivo
.
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
........
A
B
C
.
...................................................................................................................................................................
.
....................................
....................................
....................................
....................................
....................................
....................................
..............
.
.......................................................................................................................................................................................................................
A continuación se construirá la matriz del juego.
i) I1II1 (Los aviones vuelan a lo largo de v́ıas de acceso diferentes; cada cañón
cubre una v́ıa diferente). Claramente ningún avión puede llegar al objetivo. La
ganancia será:
a11 = 0
ii) I2II1 (Los aviones vuelan juntos a lo largo de una de las v́ıas; cada cañón cubre
una v́ıa diferente). Aqúı, un avión llegará ileso al objetivo:
a21 = 1
iii) I1II2 (Los aviones vuelan a lo largo de v́ıas diferentes; se tienen dos cañones en
una de las v́ıas y uno en otra; la tercera v́ıa no está defendida). La probabilidad
de que uno de los aviones llegue al objetivo es igual a la probabilidad de que
uno de ellos elija la v́ıa no defendida:
a12 =2
3
Avila Garcia
-
3.7. Técnica de dominación 30
iv) I2II2 (Los aviones vuelan a lo largo de uno de las v́ıas; dos cañones cubren una
de las v́ıas, el tercer cañón cubre otra y la tercera v́ıa se deja indefensa; esto
significa que, en efecto, sólo una de las v́ıas está cubierta, mientras que dos
quedan indefensas). La probabilidad de que por lo menos un avión pasará es
igual a la probabilidad de que la v́ıa elegida no sea la que está cubierta por los
dos cañones:
a22 =2
3
v) I1II3 (Los aviones vuelan a lo largo de v́ıas diferentes; todos los cañones cubren
la misma v́ıa). Es seguro que uno de los aviones llega hasta el blanco:
a13 = 1
vi) I2II3 (Los aviones vuelan a lo largo de una v́ıa de acceso; todos los cañones
cubren la misma v́ıa) Para que el objetivo sea destruido, los aviones deben
elegir una v́ıa no defendida:
a23 =2
3
La matriz de 2× 3 se muestra aqúı.
II1 II2 II3
I1 023
1
I2 123
23
Es claro, que la estrategia II3 es dominada por la estrategia II2. Por lo tanto,
podemos eliminar II3 y reducir la matriz a un juego de 2× 2. La matriz de 2× 2 semuestra aqúı. Esta matriz tiene un punto de silla: los valores inferior y superior del
juego son los mismos:
v =2
3
II1 II2
I1 023
I2 123
Nótese también que la estrategia I1 es dominada por la estrategia I2. La solución del
juego es que ambos jugadores deben usar estrategias puras, la I2 y la II2. Es decir,el
Avila Garcia
-
3.8. Método Algebraico 31
jugador I siempre debe enviar ambos aviones juntos, eligiendo al azar la v́ıa de acceso
particular, mientras que el jugador II debe cubrir una v́ıa con dos cañones y otra
con el tercero, también eligiendo al azar las dos v́ıas. Nótese que, en este caso, aun
las estrategias “puras” contienen elecciones que rige al azar. Con estas estrategias
óptimas, la ganancia media siempre será v = 23; es decir, el objetivo será destruido
con una probabilidad de v = 23. Hay un rango cont́ınuo de estrategias mixtas que son
óptimas para I, yendo desde p1 = 0 hasta p1 =13.
3.8. Método Algebraico
Los juegos finitos más sencillos, que siempre pueden resolverse por medio de
métodos elementales, son los juegos de 2× 2 y los de 2× n. Considérese un juego de2× 2 con la matriz que se muestra. Si este juego tiene un punto de silla, la soluciónconsiste de la pareja de estrategias puras que se intersectan en el punto silla.
II1 II2
I1 a11 a12
I2 a21 a22
Supóngase que el juego no tiene punto de silla, de modo que los valores inferior
y superior del juego son desiguales. Se desea hallar nuestra estrategia mixta óptima
S∗i =
(I1 I2
p1 p2
)(3.9)
la cual tiene la propiedad de que no importa lo que haga el oponente (en tanto que
sólo use sus estrategias convenientes) la ganancia promedio será igual a v, el valor del
juego. En un juego de 2× 2 sin punto de silla, ambas estrategias de nuestro oponenteson puras convenientes. En caso contrario, la solución consistiŕıa de estrategias puras,
lo cual significa que tendrá un punto de silla. De aqúı que si nos adherimos a nuestra
estrategia óptima el oponente puede usar cualquiera de sus estrategias puras II1, II2
sin cambiar la ganancia media v. Esto proporciona dos ecuaciones:
a11p1 + a21p 2 = v,
a12p1 + a22p 2 = v,(3.10)
Avila Garcia
-
3.8. Método Algebraico 32
Puesto que p1 + p2 = 1, a partir de estas ecuaciones se ve que:
a11p1 + a21 (1− p1) = a12p1 + a22 (1− p1) ,
o bien
p1 =a22 − a21
a11 + a22 − a12 − a21, (3.11)
p2 = 1− p1 (3.12)
El valor v del juego se encuentra substituyendo los valores de p1 y p2 en
cualquiera de las ecuaciones 3.10.
Análogamente se puede aplicar para q1, q2, que nos proporciona dos ecuaciones:
a11q1 + a12q 2 = v,
a21q1 + a22q 2 = v,(3.13)
Puesto que q1 + q2 = 1, a partir de estas ecuaciones se ve que:
a11q1 + a12 (1− q1) = a21q1 + a22 (1− q1) ,
o bien
q1 =a22 − a12
a11 − a12 − a21 + a22, (3.14)
q2 = 1− q1 (3.15)
Por otro lado, también se puede calcular el valor de q1 y q2, conociendo el valor
del juego, digamos:
a11q1 + a12q2 = v.
Puesto que q1 + q2 = 1, se tiene:
q1 =v − a12
a11 + a12, (3.16)
q2 = 1− q1. (3.17)
Avila Garcia
-
3.8. Método Algebraico 33
Ejemplo 3.8.1
El grupo de administración de la empresa Pascual, ha recibido el encargo de
preparar una estrategia que pueda seguir la empresa durante las próximas negocia-
ciones. En su experiencia anterior, el grupo ha desarrollado las siguientes estrategias
para la empresa Pascual:
C1 = Se esperan negociaciones muy dif́ıciles con los trabajadores
C2 = Se considera que las peticiones de los trabajadores son prácticas.
C3 = Se considera que las peticiones de los trabajadores son poco prácticas.
C4 = Amplias variaciones en las peticiones de los trabajadores.
De acuerdo con su historia pasada, los trabajadores sugieren las siguientes es-
trategias:
U1 = Peticiones muy costosas de parte de los trabajadores
U2 = Peticiones costosas de parte de los trabajadores
U3 = Peticiones normales de parte de los trabajadores
U4 = Peticiones favorables a la empresa, pero no para los trabajadores
El problema de cuál estrategia debe emplear el grupo de administración de la empresa
Pascual, depende de la estrategia que adopten los trabajadores (que es dif́ıcil conocer).
Sin embargo, con ayuda de la Secretaŕıa del Trabajo y Previsión Social (STPS - de
donde han solicitado apoyo en vista de las perspectivas de unas negociaciones muy
dif́ıciles con los trabajadores, y la posibilidad de una huelga prolongada), el grupo
de administración preparó una tabla de costos de un aumento condicional de salarios
(tabla 1). La STPS indicó que los trabajadores prepararon una tabla semejante, porque
se les ha proporcionado la misma información.
La tabla de costos del aumento condicional de salarios se interpretará como
sigue: si la administración de la empresa Pascual adopta la estrategia C1 y el sindicato
adopta la estrategia U1 el contrato final estipulará que la compañ́ıa concedeŕıa un
aumento de $25.00. Las demás anotaciones de la tabla 1 tienen el mismo significado.
En vista de esas cifras, ¿qué harán los negociadores?.
Avila Garcia
-
3.8. Método Algebraico 34
Tabla de costos de un aumento condicional de salarios (matriz de 4× 4)
Estrategias
de lostrabajadores
Estrategias de la esmpresa Pascual
C1 C2 C3 C4
U1 +$25.00 +$14.00 +$15.00 +$32.00
U2 +$40.00 +$17.00 +$13.00 +$16.00
U3 +$30.00 +$5.00 +$12.00 +$15.00
U4 −$1.00 +$8.00 +$11.00 +$3.00
En cualquier problema de la teoŕıa de juegos, el primer paso consiste en hacer
la prueba del punto de silla, que en este caso especial no es aplicable. El siguiente
consiste en examinar la matriz para buscar si hay algún dominio que pueda aplicarse,
y entonces puede preguntarse: ¿por qué deben jugar los trabajadores el renglón U4, ya
que esto daŕıa a la empresa la posibilidad de ganar, o aceptar un aumento menor?. Es
claro, que los trabajadores nunca jugarán el renglón U4, porque pueden obtener mejores
resultados jugando los renglones U1 y U2. Por lo tanto, el renglón U4 está dominado
y se desecha, porque una o más estrategias siempre proporcionarán a los trabajadores
un mejor pago que el de la estrategia dominada, independientemente de lo que haga
la empresa respecto a la regla de renglones, todas las anotaciones de los renglones U1
y U2, son iguales o mayores que la anotación correspondiente del renglón U4, desde
el punto de vista de la S.T.P.S, lo que reduce la matriz original 4 × 4, a la de 3 × 4que se muestra en la siguiente tabla.
Tabla de costos de un aumento condicional de salarios (matriz de 3× 4)
Estrategias
de lostrabajadores
Estrategias de la empresa Pascual
C1 C2 C3 C4
U1 +$25.00 +$14.00 +$15.00 +$32.00
U2 +$40.00 +$17.00 +$13.00 +$16.00
U3 +$30.00 +$5.00 +$12.00 +$15.00
Una inspección adicional revela que la columna C4 está dominada por la colum-
na C3, porque la empresa está tratando de reducir al mı́nimo sus pérdidas. Todas las
entradas de la columna C3 son iguales o menores que la anotación correspondiente de
la columna C4, de acuerdo con la regla de columnas. La nueva matriz de 3×3 apareceen la tabla.
Avila Garcia
-
3.8. Método Algebraico 35
Tabla 3: Costos de un aumento condicional de salarios (matriz de 3× 3)
Estrategias
de lostrabajadores
Estrategias de la empresa Pascual
C1 C2 C3
U1 +$25.00 +$14.00 +$15.00
U2 +$40.00 +$17.00 +$13.00
U3 +$30.00 +$5.00 +$12.00
La inspección de la tabla 3 revela que el renglón U3 está dominado por el renglón
U2. Los aumentos de salarios del renglón U2 ($40.00, $17.00 y $13.00), son iguales o
mayores que las anotaciones correspondientes del renglón U3 ($30.00, $5.00 y $12.00).
La nueva matriz de 2× 3 aparece en la tabla 4.
Tabla 4: Costos de un aumento condicional de salarios (matriz de 2× 3)
Estrategias
de lostrabajadores
Estrategias de la empresa Pascual
C1 C2 C3
U1 +$25.00 +$14.00 +$15.00
U2 +$40.00 +$17.00 +$13.00
La última oportunidad para aplicar el dominio ocurre en la columna C1. Desde
el punto de vista de la empresa, los aumentos propuestos, que se muestran en la
columna C2 (+$14.00 y +$17.00), son iguales o menores que los de la columna C1
(+$25.00 y +$40.00). La matriz resultante es de 2× 2 (tabla 5). Hay que notar queel procedimiento de dominio puede emplearse para remover más de un renglón o una
columna en el mismo paso.
Tabla de costos de un aumento condicional de salarios (matriz de 2× 2)
Estrategias
de lostrabajadores
Estrategias de la empresa Pascual
C2 C3
U1 +$14.00 +$15.00
U2 +$17.00 +$13.00
Avila Garcia
-
3.8. Método Algebraico 36
Obsérvese que después de realizar la técnica de dominación, ésta última matriz tam-
poco tiene punto de silla, se aplicará el método algebraico para la solución de este
juego.
Aplicando (3.11), se calcula el valor de p, obtenemos:
p1 =13− 17
14 + 13− 15− 17=
4
5
Por lo tanto
p 2 = 1− p 2 = 1−4
5=
1
5
El cálculo anterior indica que los trabajadores jugarán el primer renglón =45 partes
del tiempo y el segundo renglón =15
Analogamente, aplicando (3.14) y (3.15), se calcula q1 y q2, obteniendo:
q1 =2
5
y
q 2 = 1− q 2 = 1−2
5=
3
5
Luego, podemos encontrar el valor del juego v, haciendo uso de las ecuaciones (3.10).
a11p1 + a21p2 = v
14
(4
5
)+ 17
(1
5
)=
56
5+
17
5=
73
5
El valor del juego es $73
5o bien $14.60, que es el aumento que pueden esperar
los trabajadores. Los trabajadores deben ganar, porque el valor del juego es positi-
vo; si fuera negativo la empresa ganaŕıa. Sin embargo, en la matriz original sólo se
presentó un valor negativo contra 15 positivos.
A continuación se ilustra está técnica para el caso de 2 jugadores, con 2 estrategias
de juego para cada uno e inexistencia de un punto silla.
Ejemplo 3.8.2
Supóngase la siguiente matriz de consecuencias:
II1 II2 Probabilidades
I1 5 35 p1
I2 20 10 p2
Probabilidades q1 q2
Avila Garcia
-
3.8. Método Algebraico 37
Solución. Si el jugador I selecciona la estrategia I1, su consecuencia esperada será:
5q1 + 35q2,
mientras que si selecciona la I2, ésta será:
20q1 + 10q2.
Como ambos valores esperados deben ser los mismos, se tiene que:
5q1 + 35q2 = 20q1 + 10q2.
Dado que qi ≤ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:
q1 + q2 = 1.
Las dos ecuaciones anteriores con dos incógnitas generan los valores
q1 = 0.625
q2 = 0.375
Análogamente, si el jugador II selecciona la estrategia II1, su consecuencia esperada
será
5p1 + 20p2,
mientras que si selecciona la II2, ésta será:
35p1 + 10p2
y, como ambas deben ser iguales, se tiene que:
5p1 + 20p2 = 35p1 + 10p2.
Dado que pi ≥ 0, i = 1, 2 son probabilidades, se debe cumplir adicionalmente que:
p1 + p2 = 1.
Las dos ecuaciones anteriores con dos incógnitas generan:
p1 = 0.25
p2 = 0.75
Avila Garcia
-
3.9. Método Geométrico para los juegos 2× n 38
El valor del juego será, entonces:
V = 5 (0.25) + 20 (0.75) = 35 (0.25) + 10 (0.75)
= 5 (0.625) + 35 (0.375) = 20 (0.625) + 10 (0.375)
= 16.25
Nótese que existen cuatro posibilidades diferentes para calcular el mismo valor V .
Lo anterior se interpreta diciendo que las estrategias mixtas para el jugador I son
(0.25, 0.75) y para II (0.625, 0.375). La consecuencia esperada es que I gane 16.25 y
II pierda la misma cantidad.
La técnica anterior se complica cuando cada jugador tiene más de dos estrategias
a elegir. La solución para un caso más general se proporcionará, con técnicas de
programación lineal. Para el caso en que un jugador tiene dos estrategias y el otro m
(m > 2), entonces los métodos gráficos trabajan adecuadamente. Éstos enseguida se
explican.
3.9. Método Geométrico para los juegos 2× n
Las soluciones gráficas son únicamente aplicables a juegos en los cuales, por lo
menos uno de los jugadores, tiene solamente dos estrategias.
Considérese el siguiente juego 2× n.
II
I
y1 y2 . . . yn
x1
x2 = 1− x1a11 a12 . . . a1n
a21 a22 . . . a2n
Supóngase que este juego no tiene un punto de silla. Puesto que I tiene dos
estrategias, se deduce que x2 = 1− x1; x1 ≥ 0, x2 ≥ 0.Los pagos esperados correspondientes a las estrategias puras de II se muestran
en la siguiente tabla.
Estrategia pura de II Pago esperado de I
1 (a11 − a21)x1 + a212 (a12 − a22) x1 + a22...
n (a1n − a2n) x1 + a2n
Avila Garcia
-
3.9. Método Geométrico para los juegos 2× n 39
Esto muestra que el pago promedio de I vaŕıa linealmente con x1. Según el criterio
minimax de juegos de estrategias mixtas, el jugador I debe seleccionar el valor de x1
que maximice sus pagos mı́nimos esperados. Esto se hace mediante el trazo de ĺıneas
rectas como funciones de x1. El siguiente ejemplo ilustra esta técnica.
Considere el siguiente juego (2× 4)
II
I
1 2 3 4
1
2
2 2 3 -1
4 3 2 6
Este juego no tiene un punto de silla. Consecuentemente, los pagos esperados
de I correspondientes a las estrategias puras de II están dados de la siguiente forma.
Estrategia pura de II Pago esperado de I
1 −2x1 + 42 −x1 + 33 x1 + 2
4 −7x1 + 6
Estas cuatro rectas se deben trazar como funciones de x1 como se muestran en la
figura. Gráficamente el maximin ocurre en x∗1 = 12 . Este es el punto de intersección dedos rectas 2, 3 y 4. Consecuentemente, la estrategia óptima de I es (x∗1 = 12 , x
∗2 =
12),
y el valor del juego se obtiene sustituyendo x1 en la ecuación de cualesquiera de las
ĺıneas que pasan por el punto maximin. De aqúı obtenemos,
v∗ =
−12
+ 3 =5
2
1
2+ 2 =
5
2
−712
+ 6 =5
2
A fin de determinar las estrategias óptimas de II se debe observar que 3 rectas
pasan por el punto maximin. Lo cual nos indica que II puede combinar las tres
estrategias.
Avila Garcia
-
3.9. Método Geométrico para los juegos 2× n 40
.
.......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... .
..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
. .............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
. ............................................. ..............................................
. ............................................. ..............................................
. ............................................. ..............................................
. ............................................. ..............................................
. ............................................. ..............................................
. ............................................. ..............................................
. ............................................. ..............................................
. ............................................. ...............................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
................................
......................
.
................................................................................................
................................................................................................
................................................................................................
................................................................................................
................................................................................................
................................................................................................
....................................................
.
..........................................................................................................................................................................................
..........................................................................................................................................................................................
..........................................................................................................................................................................................
..................................................
.
................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
−2−1
x1 = 0
4
1
23
x1 = 1
1
2
3
4
5
6
Pagopromedio
x∗1 =12
v∗ = 52
?
Maximin
Dos rectas cualesquiera que tengan signos opuestos en sus pendientes definen
una solución óptima alternativa. Por consiguiente, de las tres combinaciones (2, 3),
(2, 4) y (3, 4), la combinación (2, 4) debe excluirse como no óptima.
La primera combinación (2, 3) implica que y∗1 = y∗4 = 0. En consecuencia, y3 = 1−y2y los pagos promedios dde II correspondientes a las estrategias puras I están dadas
como sigue:
Estrategia pura de I Pago esperado de II
1 −y2 + 32 y2 + 2
Por consiguiente,y∗2 (correspondiente al punto minimax) puede determinarse de
−y∗2 + 3 = y∗2 + 2
Esto da por resultado y∗2 = 12 .
Obsérvese que si sustituimos y∗2 =1
2en los pagos esperados de II dados an-
teriormente, el valor minimax es5
2, el que es igual al valor del juego v∗ como es de
esperarse.
La combinación restante (3, 4) puede ser tratada da manera similar para obtener
una solución óptima alternativa. Cualquier promedio ponderado de las combinaciones
(2, 3) y (3, 4) proporcionará también una nueva solución óptima que mezcle las tres
estrategias 2, 3 y 4.
Avila Garcia
-
3.10. Solución de juegos 2 x 2 con engaño 41
3.10. Solución de juegos 2 x 2 con engaño
Considérese a continuación un juego más complicado, uno cuya solución no es
tan obvia. Es un ejemplo sencillo pero instructivo de juegos que contienen engaño. En
las situaciones antagónicas que se presentan en la vida real, se usan muchos recursos
para engañar al oponente (información falsa, representación falsa de objetivos, etc.).
Ejemplo 3.10.1
Se tienen dos cartas, un as y un dos, con la cara hacia abajo sobre la mesa. El
jugador I levanta una de ellas al azar, sin mostrarla al jugador II. Si la carta es el
as, I debe decir “Tengo el as” y pedir $1.00 a II. Si la carta es el dos, I puede decir:
“Tengo el dos” y pagar $1.00 a II, o bien, “tengo el as” y pedir $1.00 a
II.
Si se le ofrece un peso a II, debe tomarlo. Si se le pide un peso, puede:
a) Creer que I tiene el as y pagarle, o bien,
b) No creerle y exigir que se le muestre la carta. Si pide que se le muestre la carta
y resulta que I tiene en efecto el as, debe pagar $2.00 a I. Si pide que le muestre
la carta y I tiene el dos, I debe pagarle $2.00. A continuación se analiza este
juego para hallar la estrategia óptima para cada bando.
Solución. El juego tiene una estructura relativamente compleja, consiste de
una jugada aleatoria y obligatoria -la elección de una carta por I- y de dos jugadas
personales que pueden hacerse o no. Si I levanta el as, no tiene opción: sólo puede
pedir $1.00 a II. Entonces II tiene una elección personal -creer a I o no creerle, (es
decir, pagarle o pedirle que le muestre la carta). Si en la primera jugada aleatoria
resulta que I levanta el dos, entonces tiene que hacer una elección -engañar o no
engañar. Si I engaña, II tiene nuevamente la misma elección -creerle o no, (es decir,
pagarle o pedir que le muestre la carta); si no engaña, II no tiene más que aceptar
su $1.00.
Las estrategias de los dos jugadores serán las reglas que adopten para determinar
sus jugadas personales.
Claramente I sólo tiene dos estrategias:
• I1 -engañar; I2 -no engañar.
Avila Garcia
-
3.10. Solución de juegos 2 x 2 con engaño 42
II también tiene dos estrategias:
• II1 -creer a I; II2 -pedir que se le muestre la carta.
Para construir la matriz del juego, se necesita calcular el valor medio de la ganancia
para cada una de las combinaciones de estrategias.
1. I1II1 I engaña; II le cree; se calcula la ganancia promedio.
i) Si I extrae el as (la probabilidad de que suceda esto es 12), no tiene jugada
personal; debe pedir $1.00 a II, y éste lo paga; la ganancia para I en pesos
es 1.
ii) Si I extrae el dos (la probabilidad de que suceda esto también es 12), engaña
y pide $1.00 a II, quien lo paga; la ganancia es nuevamente 1.
La ganancia promedio es
a11 =
(1
2
)(1) +
(1
2
)(1) = 1. (3.18)
2. I1II2 I engaña; II pide que se le muestre la carta; hay que calcular a12.
i) Si I extrae el as, no tiene jugada personal; debe pedir $1.00 a II; II pide
que se le muestre la carta y, como consecuencia, debe pagar $2.00 a I (la
ganancia para I en pesos es 2).
ii) Si I extrae el dos, engaña y pide $1.00 a II; II pide que se le muestre la
carta y, como resultado, recibe $2.00 de I (la ganancia de I en pesos es
−2).
La ganancia promedio es
a12 =
(1
2
)(+2) +
(1
2
)(−2) = 0. (3.19)
3. I2II1 I no engaña; II no le reta; calculemos:
i) Si I extrae el as, pide $1.00; II lo paga y la ganancia para I en pesos es 1.
ii) Si I extrae el dos, le paga $1.00 a II y II tiene que aceptarlo (la ganancia
de I en pesos es −1). La ganancia promedio es:
a21 =
(1
2
)(+1) +
(1
2
)(−1) = 0. (3.20)
Avila Garcia
-
3.10. Solución de juegos 2 x 2 con engaño 43
4. I2II2 I no engaña; II le reta; calculemos:
i) Si I extrae el as, pide $1.00; II pide que se le muestre la carta y, como
resultado, debe pagar $2.00 a I (la ganancia en pesos es +2).
ii) Si I extrae el dos, paga $1.00 a I, quien debe aceptarlo (la ganancia es
−1).
La ganancia promedio es:
a22 =
(1
2
)(+2) +
(1
2
)(−1) = 1
2. (3.21)
La matriz del juego se muestra aqúı.
II1 II2
I1 1 0
I2 012
El valor inferior del juego es 0, el valor superior es1
2y el juego no tiene punto de
silla. Por tanto, la solución debe consistir de estrategias mixtas. Aplicando la ecuación
(3.11), se obtiene:
p1 =12
1 + 12
=1
3, p2 =
2
3, S∗I =
(I1 I213
23
).
Es decir, I debe engañar en 13
de las ocasiones y no engañar en 23
de las mismas.
Entonces podemos calcular la ganancia promedio o valor del juego:
v =1
3.
El hecho de que v = 13
> 0 significa que el juego tal y como se presenta no es equitativo
para II. Aplicando su estrategia óptima, I siempre puede estar seguro de obtener una
ganancia promedio de 13. Nótese que aplicando su estrategia más cautelosa (maximin)
(en este caso, tanto I1 como I2 son maximin) I puede garantizarse una ganancia de
0, de modo que según las reglas del juego, al aplicar una estrategia mixta, obtiene
una ventaja sobre II.
Hállese la estrategia óptima para II. Se tiene:
(1) q1 + (0) q2 =1
3; q1 =
1
3, q2 =
2
3.
Avila Garcia
-
3.11. Método de subjuegos para encontrar el valor del juego 44
de aqúı que:
S∗II =
(II1 II2
13
23
).
Es decir, el jugador II debe creerle al jugador I en 13
de los casos y pedir que le
muestre la carta en 23. Entonces perderá, en promedio, en 1
3de las veces. Si aplica su
estrategia pura minimax II2 (pedir que se le muestre la carta), perdeŕıa en promedio,12
de las veces.
3.11. Método de subjuegos para encontrar el valor
del juego
Este método nos facilita el encontrar el valor del juego para un juego de 2× 2,y muchos juegos más grandes pueden reducirse mediante el dominio a un juego de
2× 2. Sin embargo, esto no incluirá todos los casos, porque esa reducción no siemprepuede hacerse. Por ejemplo, dos ĺıneas aéreas cubren la misma ruta, y ambas tratan
de obtener la mayor porción posible del mercado. Una de las ĺıneas aéreas I, parece
más agresiva, porque su situación financiera es muy sólida y su departamento de
mercadotecnia conoce mejor las condiciones del mercado. La matriz de pagos de la
siguiente tabla muestra las pérdidas y las ganancias mensuales de pasajeros, basadas
en ciertas condiciones del mercado. La matriz se lee de este modo: los valores positivos
favorecen a la ĺınea aérea I, mientras que los negativos favorecen a la ĺınea aérea II.
Tabla de matriz de pagos de 2× 3 de dos ĺıneas áereas
Ĺınea:Aereoméxico(jugador I)
Ĺınea: Mexicana de aviación (jugador II)
A B C
B 300 −25 −50C 150 155 175
A: No hace nada.
B: Anuncia tarifas ordinarias y especiales.
Avila Garcia
-
3.11. Método de subjuegos para encontrar el valor del juego 45
C: Anuncia caracteŕısticas especiales (peĺıculas cinematográficas y magńıficos ali-
mentos.
El juego de 2× 3 expresado en la tabla anterior, puede considerarse como tresjuegos de 2× 2.
Subjuego 1:M
A
(300 −25150 155
)columnas 1 y 2.
subjuego 2:M
A
(300 −50150 175
)columnas 1 y 3.
Subjuego 3:M
A
(−25 −50155 175
)columnas 2 y 3.
La ĺınea aérea II, que puede escoger no jugar una de las columnas, está tratando de
determinar la combinación de una estrategia de dos columnas que sea la mejor para
ella. Como se hizó notar anteriormente, el jugador que tenga el mayor número de
columnas o renglones, tiene la mayor flexibilidad, lo que generalmente da por resultado
una estrategia mejor. Sin embargo, en este juego hay cuatro valores positivos contra
dos negativos. A fin de obtener la solución de la mejor estrategia para la ĺınea aérea
II, habrá que resolver las estrategias y valores del juego de los tres subjuegos de 2×2.Nótese que cuando no se juega una columna, se representa con un cero. Después puede
usarse cualquiera de los métodos anteriormente vistos.
Subjuego 1:
M
A
(300 −25150 155
)no se está jugando la tercera columna.
Estrategias:
A =1
66,65
66
M =36
66,30
66, 0.
Avila Garcia
-
3.11. Método de subjuegos para encontrar el valor del juego 46
Valor del juego: 152.27
Subjuego 2:
M
A
(300 −50150 175
)no se está jugando la segunda columna.
Estrategias:
A =1
15,14
15
M =9
15, 0,
6
15.
Valor del juego: 160.
Subjuego 3:
M
A
(−25 −50155 175
)no se está jugando la primera columna.
Estrategias:
A = 0, 1
M = 0, 1, 0.
Valor del juego: 155.
De acuerdo con los cálculos precedentes, se escoge el valor positivo más bajo,
en este caso el subjuego 1, porque la ĺınea aérea II tiene más flexibilidad. Aunque
la ĺınea aérea I debe jugar cualquier renglón, la ĺınea aérea II no tiene que jugar
las tres columnas, sino dos solamente. La estrategia de la ĺınea aérea II consiste en
jugar la primera columna del tiempo, y la segunda, del tiempo. La ĺınea aérea II no
utilizará la tercera columna. Puede comprobarse que esta estrategia es la óptima si
se observa detalladamente la matriz original.
La solución (valor del juego de 152.52 en favor de la ĺınea aérea I), indica que
I escoge su estrategia mixta de tal modo que gane (o pierda) lo mismo, independi-
entemente de la selección de la columna de II. Como se expresó anteriormente sobre
la forma de determinar una estrategia mixta, las expectaciones de I al jugar una
Avila Garcia
-
3.11. Método de subjuegos para encontrar el valor del juego 47
estrategia mixta (entre sus renglones), son las mismas, independientemente de lo que
juegue II. Esto puede expresarse algebraicamente haciendo que el valor del juego del
subjuego 1, sea igual a la columna que juegue II, lo que se demuestra como sigue:
Las ecuaciones precedentes significan que I espera ganar 152.27 clientes, inde-
pendientemente de la selección de II. El signo ≥ significa que I podŕıa ganar más de152.27 clientes si II escogiera una estrategia incorrecta. Si las estrategias que hemos
encontrado son óptimas, deben satisfacer las tres desigualdades anteriores. Substi-
tuyendo los valores de I1 (1 ) y de I2 ( ), los resultados son los siguientes.
Las tres desigualdades se satisfacen con los valores insertados para las estrate-
gias de I. Sin embargo, cuando II juega la columna 3, I gana más de 152.27 clientes,
porque ésa es una mala estrategia para II, y ésta es la razón de que II no juegue la
columna 3, porque daŕıa a I una ventaja adicional en un juego que la favorece.
Como los requerimientos de las estrategias de I se satisfacen, el paso siguiente
es examinar las estrategias de II, para determinar si son óptimas. II ha sus escogido
estrategias de tal modo que pueda reducir al mismo sus pérdidas, lo que puede ex-
presarse algebraicamente haciendo que el valor del juego del subjuego 1 sea igual a
los renglones que juegue I:
Las desigualdades precedentes significan que II espera perder 152.27 clientes,
independientemente de las selecciones de I. El signo ≤ indica que II puede perdermenos, Si I escoge estrategias incorrectas. De nuevo, si las estrategias que hemos en-
contrado son óptimas, deben satisfacer las dos últimas desigualdades. Si substituimos
los valores de II1 II2 y II3, los resultados son los siguientes.
Columna 1:
300
(1
66
)+ 150
(65
66
)≥ 152.27; 4.54 + 147.73 = 152.27
Columna 2:
−25(
1
66
)+ 155
(65
66
)≥ 152.27; −0.38 + 152.65 = 152.27
Columna 3:
−50(
1
66
)+ 175
(65
66
)≥ 152.27; −0.76 + 172.35 > 152.27
Avila Garcia
-
3.11. Método de subjuegos para encontrar el valor del juego 48
Luego,
171.59 > 152.27
Las tres desigualdades se satisfacen con los valores insertados para las estrate-
gias de A. Sin embargo, cuando M juega la columna 3, A gana más de 152.27 clientes,
porque ésa es una mala estrategia para M , y ésta es la razón de que M no juegue la
columna 3, porque daŕıa a A una ventaja adicional en un juego que la favorece.
Avila Garcia
-
Caṕıtulo 4
Programación Lineal
4.1. Teorema del Mı́nimax
Teorema 4.1.1 (Teorema del Mı́nimax)
En todo juego bipersonal finito de suma cero, existen estrategias óptimas x∗ ∈ X,y∗ ∈ Y para cada jugador y se verifica vMI = vMII = v∗ siendo v∗ el valor del juego.
Demostración. Considérense los siguientes Programas Lineales: Primal y
Dual, respectivamente.
Jugador I Jugador II
Primal Dual
máx−v Min v
a11x1 + · · ·+ am1xm ≥−v a11y1 + · · ·+ a1nyn ≤ v
· · · · · · · · · · · · · · · · · · · · · · · ·
a1nx1 + · · ·+ amnxm ≥−v am1y1 + · · ·+ amnyn ≤ v
x1 + · · ·+ xm = 1 y1 + · · ·+ yn = 1
0 ≤ xi ≤ 1, i = 1, . . . ,m 0 ≤ yj ≤ 1, j = 1, . . . , n
Obsérvese que el nivel de seguridad para una estrategia mixta x̂ ∈ X viene dado por:
vI (x̂) = vII (x̂) = mı́ny∈Y
x̂ tAy,
49
-
4.1. Teorema del Mı́nimax 50
cuyo valor puede obtenerse por medio del dual, es decir
Máx λ (x̂)
sujeto a ~e λ (x̂) ≤ x̂ tA
x̂ ∈ X, λ (x̂) ∈ R
donde ~e = (1, . . . , 1) t
Las estrategias que proporcionan los mejores nivel