Un Primer Curso de Teoria de Juegos Cap01

60
.. ROBERT GIBBONS Universidad de Cornell UN PRIMER CURSO DE TEORIA DE JUEGOS I Traduccion de Paloma Calvo y Xavier Vila Universidad de Northwestern Antoni Bosch 0 editor

description

primer capitulo teoría de juegos en economía

Transcript of Un Primer Curso de Teoria de Juegos Cap01

  • ..

    ROBERT GIBBONSUniversidad de Cornell

    UN PRIMER CURSODE TEORIA DE JUEGOS

    I

    Traduccion dePaloma Calvoy Xavier Vila

    Universidad de Northwestern

    Antoni Bosch0 editor

  • Publicado por Antoni Bosch, editorManuel Girona, 61 - 08034 BarcelonaTel. (93) 205 26 06 - Fax (93) 280 48 02E-mail: antonibosch.editorbcn.servicom.eshttp://www.seker.es/insite/antonibosch

    1992 by Robert Gibbons de la edici6n en castellano: Antoni Bosch, editor, S.A.

    Titulo original de la obra:A Primer in Game Theory

    ISBN: 84-85855-69-8Dep6sito legal: B-12.255-1997

    Disefio de la cubierta: Enric Satue

    Composici6n: Alemany, S.c.c.L.Impresi6n: UberDuplexEncuadernacion: INRESA

    No se perrnite la reproducci6n total 0 parcial de este Iibro, ni su incorporaci6n a unsistema informatico, ni su transmisi6n en cualquier forma 0 por cualquier medic, seaeste electr6nico, mecanico, reprografico, gramof6nico u otro, sin el permiso previo ypor escrito del editor .

    ..

  • CONTENIDO

    ,

    1

    Prefacio IX

    1 Juegos estaticos con informaci6n completa 11.1 Teoria basica: Juegos en forma normal y equilibrio de Nash 2

    1.1.A Representaci6n de los juegos en forma normal 21.1.B Eliminaci6n iterativa de las estrategias

    estrictamente dominadas 4l.1.C Fundamentaci6n y definici6n del equilibrio de Nash 8

    1.2 Aplicaciones 151.2.A Modelo de duopolio de Cournot 151.2.B Modelo de duopolio de Bertrand 211.2.C Arbritraje de oferta final 231.2.D El problema de los ejidos 27

    1.3 Teoria avanzada: Estrategias mixtas y existencia deequilibrio 29

    1.3.A Estrategias mixtas 291.3.B Existencia del equilibrio de Nash 33

    1.4 Lecturas adicionales 471.5 Ejercicios 481.6 Referencias 51

    2 Juegos dinamicos con informaci6n completa 532.1 Iuegos dinamicos con informaci6n completa y perfecta 55

    2.1.A Teoria: Inducci6n hacia atras 552.1.B EI modelo de duopolio de Stackelberg 592.1.C Salarios y nivel de empleo en una empresa con fuerte

    implantaci6n salarial 622.1.D Negociaci6n secuencial 66

    2.2 Iuegos en dos etapas con informaci6n completa peroimperfecta 69

  • VI / CONTENIOO

    2.2.A Teorfa: Perfecci6n en subjuegos 692.2.B Panico bancario 712.2.C Aranceles y competencia intemacional imperfecta 732.2.0 Torneos 77

    2.3 Juegos repetidos 802.3.A Teoria: Juegos repetidos en dos etapas 802.3.B Teoria: Juegos repetidos infinitamente 872.3.C Colusi6n entre duopolistas de Coumot 1012.3.0 Salarios de eficiencia 1062.3.E Politica monetaria estable en el tiempo 112

    2.4 Juegos dinamicos con informaci6n completa peroimperfecta 115 ..

    2.4.A Representaci6n de los juegos en forma extensiva 1152.4.B Equilibrio de Nash perfecto en subjuegos 122

    2.5 Lecturas adicionales 1292.6 Ejercicios 130

    2.7 Referencias 139

    3 Juegos estaticos con informaci6n incompleta 1433.1 Teoria: juegos bayesianos estaticos y equilibrio bayesiano

    de Nash 1443.1.A Un ejemplo: Competencia a la Coumot bajo

    informaci6n asimetrica 1443.1.B Representaci6n en forma normal de juegos

    bayesianos estaticos 1463.1.C Definicion del equilibrio bayesiano de Nash 150

    3.2 Aplicaciones 1523.2.A Revisi6n de las estrategias mixtas 1523.2.B Una subasta 1553.2.C Una subasta doble 159

    3.3 El principio de revelaci6n 1643.4 Lecturas adicionales 1693.5 Ejercicios 169 It

    I3.6 Referencias 172

    4 Juegos dinamicos con informaci6n incompleta 1754.1 Introducci6n al equilibrio bayesiano perfecto 1774.2 Juegos de sefializacion 185

    4.2.A Equilibrio bayesiano perfecto en juegos desefializacion 185

  • CONTENIDO / vn

    4.2.B Sefializaci6n en el mercado de trabajo 1924.2.C Inversi6n empresarial y estructura de capital 2074.2.D Politica monetaria 210

    4.3 Otras aplicaciones del equilibrio bayesiano perfecto 2134.3.A Juegos con parloteo (cheap-talk games) 2134.3.B Negociaci6n sucesiva bajo informaci6n asimetrica 2214.3.C La reputaci6n en el dilema de los presos repetido

    finitamente 2274.4 Refinamientos del equilibrio bayesiano perfecto 2364.5 Lecturas adicionales 2484.6 Ejercicios 2494.7 Referencias 257

    Indice analitico 261

    II'

  • PREFACIO

    La teorfa de juegos es el estudio de problemas de decision multipersona-les. Tales problemas se plantean frecuentemente en economfa. Como esbien sabido, por ejemplo, en situaciones de oligopolio se dan tipicamenteproblemas de este tipo (cada empresa debe tener en cuenta 10 que haranlas demas). Pero muchas otras aplicaciones de teoria de juegos surgenen campos ajenos a la organizaci6n industrial. A nivel micro econ6mico,muchos modelos de intercambio (como los de negociacion y de subasta)utilizan teoria de juegos. A un nivel de agregacion intermedio, y en elcampo de la economia laboral 0 de la economia financiera se utiliza lateoria de juegos en modelos de comportamiento de las empresas en losmercados de factores, 0 para dilucidar problemas de decision multiperso-nales dentro de ellas: varios trabajadores compitiendo por un ascenso, va-rios departamentos compitiendo por unos mismos recursos. Finalmente,al nivel mas alto de agregacion, en el campo de la economia internacional,se utiliza en modelos en los que los paises compiten (0 coluden) en susdecisiones arancelarias y, en general, en una polftica economica exterior;o en macroeconomia, para analizar los resultados de la pol:itica monetariacuando el gobierno y los agentes que determinan los salarios 0 los preciosse comportan estrategicamente.

    Este libro esta concebido para presentar la teorfa de juegos a quienesmas tarde construiran (0, al menos, consumiran) los modelos de la teorfade juegos en los ambitos aplicados de la economia. Se han procuradoresaltar en el las aplicaciones de la teoria, tanto al menos como la pro piateoria, por tres razones. En primer lugar, porque las aplicaciones ayudana ensefiar la teoria. En segundo lugar, porque las aplicaciones ilustran elproceso de construccion de modelos; es decir, el proceso de traduccionde la descripcion informal de una determinada situacion a un problemaformal de teorfa de juegos para ser analizado. En tercer lugar, porquelas diversas aplicaciones permiten comprobar que problemas similaressurgen en areas diferentes del analisis economico, y que los mismos ins-trumentos de teorfa de juegos pueden aplicarse en cada situacion, Para

  • x / PREFACIO

    subrayar el amplio alcance potencial de los juegos los ejemplos habitualesde organizacion industrial han side sustituidos en gran medida por apli-caciones en el ambito de la economia laboral, de la macroeconomia y deotros campos aplicados del analisis economico.'

    Discutiremos cuatro tipos de juegos: juegos estaticos con informacioncompleta, juegos dinamicos con informacion completa, juegos estaticoscon informacion incompleta y juegos dinamicos con informacion incom-pleta. (Un juego tiene informacion incompleta si un jugador no conoce lasganancias de otro jugador, como ocurre en una subasta cuando uno de loslicitadores no sabe cuanto esta dispuesto a pagar otro licitador por el biensubastado.) Correspondiendo a estas cuatro clases de juegos habra cuatronociones de equilibrio: equilibrio de Nash, equilibrio de Nash perfecto ensubjuegos, equilibrio bayesiano de Nash y equilibrio bayesiano perfecto.

    Existen dos maneras (relacionadas) de entender estos conceptos deequilibrio. Primero, se pueden entender como sucesiones de conceptosde equilibrio cada vez mas pod eros os, donde las definiciones mas podero-sas (es decir, mas .restrictivas) constituyen intentos de eliminar equilibriospoco plausibles permitidos por nociones de equilibrio mas debiles, Ve-remos, por ejemplo, que el equilibrio de Nash perfecto en subjuegos esmas poderoso que el equilibrio de Nash, y que el equilibrio bayesianoperfecto es a su vez mas poderoso que el equilibrio de Nash perfecto ensubjuegos. Segundo, puede afirmarse que el concepto de equilibrio rele-vante es siempre el equilibrio bayesiano perfecto (0 quizas un conceptode solucion aun mas poderoso), aunque este es equivalente al equilibriode Nash en juegos estaticos con informacion completa, equivalente a laperfeccion en subjuegos en juegos dinamicos con informacion completa (yperfecta) y equivalente al equilibrio bayesiano de Nash en juegos estaticoscon informacion incompleta.

    Este libro puede utilizarse de dos formas. A los estudiantes de eco-nomia de primer afio de doctorado, muchas de las aplicaciones 1es seranya familia res, por 10 que la parte de teoria de juegos se puede cubrir enmedio semestre, dejando muchas de las aplicaciones para ser estudiadasfuera de clase. A los estudiantes de licenciatura, conviene presentarlesla teoria un poco mas despacio, y cubrir en clase virtualmente todas lasaplicaciones. El prerrequisito matematico fundamental es el calculo di-ferenda 1 en una variable; los rudimentos de probabilidad y analisis seintroducen a medida que se necesitan.

    1 Una buena fuente de aplicaciones de teorfa de juegos en el ambito de la organizaci6nindustrial es Teoria de la organizacion industrial, de Tirole (Ariel, 1990).

  • Prefacio / XI

    Aprendi teoria de juegos con David Kreps, John Roberts y BobWilsondurante mis estudios de doctorado, y con Adam Brandemburger, DrewFudenberg y Jean Tirole mas adelante. A ellos debo la parte te6rica de estelibro. El enfasis en las aplicaciones y otros aspectos del estilo pedag6gicodellibro, en cambio, se los debo en gran parte a los estudiantes del de-partamento de economia del M.I.T. quienes, de 1985 a 1990, inspiraron ymoldearon los cursos que han cuIminado en este libro. Estoy muy agra-decido a todos estos amigos por las ideas que han compartido conmigoy el estfrnulo que siempre me han otorgado, asi como por los numerososcomentarios iitiles al borrador del libro que he recibido de Joe Farrell,MiltHarris, George Mailath, Matthew Rabin, Andy Weiss y varios criticosan6nimos. Finalmente, me complace reconocer los consejos y apoyo quehe recibido de Jack Repcheck de Princeton University Press y la ayuda fi-nanciera de una beca Olin en economfa del National Bureau of EconomicResearch.

  • 1. JUEGOS ESTATICOS,

    CON INFORMACION COMPLETA

    En este capitulo consideramos juegos simples de la siguiente forma: pri-mere los jugadores forman decisiones simultaneamente: a continuaci6nreciben sus ganandas, que dependen de la combinaci6n de acciones queacaban de elegir. Dentro de la clase de estos juegos estaticos (0 de decisi6nsimultanea), restringimos nuestra atenci6n a los juegos con informaci6ncompleta. Es decir, la funci6n de ganancias de cada jugador (la funci6nque determina la ganancia de cad a jugador a partir de la combinaci6nde acciones elegidas por los jugadores) es conocida por los jugadores.Estudiamos los juegos dinamicos (0 de toma de decisiones sucesivas) enlos capitulos 2 y 4, Y los juegos con informacion incompleta (juegos enlos cuales algun jugador no esta seguro de la funci6n de ganancias deotro jugador, como ocurre en una subasta en la cuallo que cada licitadoresta dispuesto a pagar por el bien subastado es desconocido por los otroslicitadores) en los capftulos 3 y 4.

    En la secci6n 1.1 entramos en las dos cuestiones basicas de la teorfa dejuegos: c6mo describir un juego y c6mo resolver el problema de teoriade juegos resultante. Con este fin describimos los instrumentos que uti-lizaremos para analizar los juegos estaticos con informaci6n completa, ysentaremos las bases de la teoria que utilizaremos para analizar juegosmas ricos en capftulos posteriores. Definimos tambien la representaci6n enforma normal de un juego y la noci6n de estrategia estrictamente dominada.Demostramos que algunos juegos pueden resolverse mediante la apli-caci6n de la idea de que los jugadores racionales no utilizan estrategiasestrictamente dominadas, pero tambien que en otros juegos este enfo-que da lugar a predicciones muy imprecisas sobre el desarrollo del juego(algunas veces tan imprecisa como la afirmacion de que "cualquier cosapuede ocurrir"). Despues, definimos el equilibrio de Nash, un concepto desoluci6n que da pie a predicciones mucho mas precisas en una clase dejuegos muy amplia.

  • 2/ JUEGOS ESTATICOS CON INFORMACION COMPLETA (c. 1)

    En la seccion 1.2, utilizando los instrumentos desarrollados en laseccion previa, analizamos cuatro aplicaciones: el modele de competenciaimperfecta de Cournot (1838), el modele de competencia imperfecta deBertrand (1883), el modele de arbitraje de oferta final de Farber (1980)y el problema de los ejidos (discutido por Hume [1739] y otros). Encada aplicaci6n, en primer lugar traducimos la descripci6n informal delproblema a una representaci6n en la forma normal del juego y despueshallamos su equilibrio de Nash. (Cada una de estas aplicaciones tiene ununico equilibrio de Nash, pero discutimos ejemplos en los cuales esto noocurre.)

    En la secci6n 1.3 volvemos a la teona. En primer Iugar definimos lanoci6n de estrategia mixta, que interpretamos en terminos de la falta de cer-teza de un jugador con respecto a 10que otro jugador hara. Seguidamente,enunciamos y discutimos el teorema de Nash (1950), el cual garantiza queun equilibrio de Nash (que puede incluir estrategias mixtas) existe en unaamplia clase de juegos. Puesto que presentamos primero la teorfa ba-sica en la secci6n 1.1, las aplicaciones en la secci6n 1.2 y, finalmente, masteorfa en la secci6n 1.3, resulta evidente que el conocimiento de la teorfaincluida en la seccion 1.3 no constituye un requisito para entender lasaplicaciones de la seccion 1.2. Por otra parte, la idea de estrategia .mixta yla existencia de equilibrio aparecen (ocasionalmente) en capfrulos poste-riores.

    Cada capitulo concluye con ejercicios, sugerencias de lectura adicionaly referencias.

    1.1 Teoria basica: Juegos en forma normal y equilibrio de Nash

    1.I.A Representacion de los juegos en forma normal

    En la representacion de un juego en forma normal cada jugador elige deforma simultanea una estrategia, y la combinacion de las estrategias ele-gidas por los jugadores determina la ganancia de cada jugador. Vamosa ilustrar la representacion en forma normal con un ejemplo clasico, eldel dilema de los presos. Dos sospechosos son arrestados y acusados deun delito. La policfa no tiene evidencia suficiente para conde-nar a lossospechosos, a menos que uno confiese. La policfa encierra a los sospe-chosos en celdas separadas y les explica las consecuencias derivadas de lasdecisiones que formen. Si ninguno confiesa, ambos seran condenados porun delito menor y sentenciados a un mes de carcel. Si ambos confiesan,

  • Teoria btisica: Juegas en {annal normal y equilibria de Nash / 3

    seran sentenciados a seis meses de carcel. Finalmente, si uno confiesa y elotro no, el que confiesa sera puesto en libertad inmediatamente y el otrosera sentenciado a nueve meses en prisi6n, seis por el deli to y tres maspor obstrucci6n a la justicia.

    EI problema de los presos puede representarse mediante la siguientematriz binaria. (Como matriz, una matriz binaria puede tener un ruimeroarbitrario de filas y columnas; binaria se refiere al hecho de que en unjuego de dos jugadores hay dos mimeros en cada casilla, las ganancias delos dos jugadores).

    Preso 2Callarse Confesar

    Preso 1Callarse -1,-1 -9,0

    Confesar 0, - 9 -6,-6

    El dilema de los presos

    En este juego, cad a jugador cuenta con dos estrategias posibles: confe-sar y no confesar. Las ganancias de los dos jugadores cuando eligen un parconcreto de estrategias aparecen en la casilla correspondiente de la ma-triz binaria. Por convenci6n, la ganancia del11amado jugador-fila (aqui elpreso 1) es la primera ganancia, seguida por la ganancia del jugador-columna (aqui el preso 2). Par eso, si par ejemplo el preso 1 elige callar yel preso 2 elige confesar, el preso 1 recibe una ganancia de -9 (que repre-senta nueve meses en prisi6n) y el preso 2 recibe una ganancia de 0 (que.representa la inmediata puesta en libertad).

    Ahara abordamos el caso general. La representacion en forma normalde un juego especifica: (1) los jugadores en el juego, (2) las estrategiasde que dispone cad a jugador y (3) la ganancia de cada jugador en cadacombinaci6n posible de estrategias. A menudo discutiremos juegos conun mimero n de jugadores, en los cuales los jugadores estan numerados de1 any un jugador arbitrario es denominado jugador i. Sea S, el conjuntode estrategias con que cuenta el jugador i (llamado espacio de estrategiasde i), y sea Si un elemento arbitrario de este conjunto. (Ocasionalmenteescribiremos s, E S, para indicar que la estrategia s; es un elementodel conjunto Si.) Sea (SI, ... ,sn) una combinaci6n de estrategias, una para

  • 4 / JUEGOS ESTATICOS CON INFORMACI6N COMPLETA (c. 1)

    cada jugador, y sea Ui la funci6n de ganancias del jugador i: Ui(81, ,8n) esla ganancia del jugador i si los jugadores eligen las estrategias (81, ,8n).Compilando toda esta informacion tenemos:

    Definicion. La representaci6n en forma normal de un juego con n jugadoresespeciiica los espacios de esiraiegias de los jugadores B1, ... .S Y sus funcionesde ganancias Ul,' .. ,Un. Denotamos este juego con G = {B1, ... ,Bn; Ul,' .. ,un}.

    Aunque hemos indicado que en un juego en forma normal los juga-dores eligen sus estrategias de forma simultanea, esto no significa que laspartes actuen necesariamente de forma simultanea. Es suficiente que cadaparte elija la accion a seguir sin conocer las decisiones de los demas, comoseria aqui el caso si los presos tomasen una decision en momentos arbitra-rios en sus celdas separadas. Ademas, aunque en este capitulo utilizamosjuegos en forma normal para representar solamente juegos estaticos enlos cuales los jugadores actuan todos sin conocer las decisiones de losdemas jugadores, veremos en el capitulo 2 que las representaciones enforma normal pueden darse en juegos con tomas de decision sucesivas,pero tambien que una alternativa, la representacion en forma extensiva deljuego, es a menudo un marco de trabajo mas conveniente para analizarlos aspectos dinamicos de los juegos.

    1.1..B Eliminacidn iterativa de estrategias estrictamente dominadas

    Despues de describir un modo de representar un juego, ahora vamos aesbozar una forma de resolver un problema de teoria de juegos. Empe-zamos con el dilema de los presos, porque es facil de resolver utilizandounicamente la idea de que un jugador racional no utilizara una estrategiaestrictamente dominada.

    En el dilema de los presos, si un sospechoso va a confesar, seria mejorpara el otro confesar y con ello ir a la carcel seismeses, en lugar de callarsey pasar nueve meses en prision, Del mismo modo, si un sospechoso va acallarse, para el otro seria mejor confesar y con ella ser puesto en libertadinmediatamente en lugar de callarse y permanecer en prision duranteun meso Asi, para el preso i, la estrategia de callarse esta dominadapor la de confesar: para cada estrategia que el preso j puede elegir, laganancia del prisionero i es menor si se calla que si confiesa. (Lo mismoocurriria en cualquier matriz binaria en la cuallas ganancias 0, -I, -6Y -9 fueran reemplazadas por las ganancias T,R,F e I respectivamente,

  • Teoria btisica: Juegos en formal normal y equilibrio de Nash / 5

    siempre que T > R > P > I, para plasmar las ideas de ganancias detentaci6n, recompensa, penalizaci6n e ingenuidad. De forma mas general:

    Definicion. En el juego en forma normal G = {SI,' .. .S: Ul, ... ,un}, sean s~y s~' posibles estrategias del jugador i (por ejemplo, s~y s~'son elementos de Si).La estrategia s~ estti estrictamente dominada por la estrategia si' si para cadacombinaci6n posible de las esiraiegias de los restantes jugadores la ganancia de ipor utilizar 8~es estrictamente menor que la ganancia de i por utilizar 8~':

    para cada (81, ... ,Si-1,Si+1, ... ,Sn) que puede ser construida a partir de los espa-cios de estraiegias de los otros jugadores SI,' .. ,Si-1,Si+1,' .. ,Sn'

    Los jugadores racionales no utilizan estrategias estrictamente domina-das, puesto que bajo ninguna conjetura que un jugador pudiera formarsesobre las estrategias que elegiran los demas jugadores seria 6ptimo utili-zar tales estrategias.! Asf, en el dilema de los presos, un jugador racionalelegira confesar, por 10que (confesar, confesar) sera el resultado al que lle-gan dos jugadores racionales, incluso cuando (confesar, confesar) suponeunas ganancias peores para ambos jugadores que (callar, callar). Comoel dilema de los presos tiene multiples aplicaciones (que incluyen la ca-rrera de armamentos y el problema del poliz6n en la provisi6n de bienespublicos) trataremos variantes del juego en los capftulos 2 y 4. Por ahoranos centraremos mas bien en si la idea de que jugadores racionales no uti-lizan estrategias estrictamente dominadas puede conducir a la soluci6nde otros juegos.

    Consideremos el juego abstracto de la figura 1.1.1.2 El jugador 1 tienedos estrategias y el jugador 2 tiene 3: S1 = {alta, baja} y S2 = {izquierda,centro, derecha}. Para el jugador 1, ni alta ni baja estan estrictamente

    f Una cuesti6n complementaria tambien tiene interes: si no existe una conjetura que eljugador i pueda formarse sobre las estrategias de los demas jugadores, que haga 6ptimo elegirla estrategia si, ,podemos concluir que debe existir otra estrategia que domine estrictamente aSi? La respuesta es afirmativa, siempre que adoptemos definiciones adecuadas de "conjetura"y de "otra estrategia", terminos que incluyen la idea de estrategias mixtas que introduciremosen la secci6n 1.3.A.

    2 La mayor parte de este libro considera aplicaciones econ6micas mas que ejemplosabstractos, tanto porque las aplicaciones son de interes por sf mismas como porque, paramuchos lectores, las aplicaciones son a menudo un modo util de explicar la teorfa subyacente.Sin embargo, cuando introduzcamos algunas ideas te6ricas basicas, recurriremos a ejemplosabstractos sin una interpretaci6n economics directa,

  • 6/ JUEGOS ESTAncos CON lNFORMA06N COMPLETA (c. 1)

    dominadas: alta es mejor que baja si 2 elige izquierda (porque 1 es mayorque 0), pero baja es mejor que alta si 2 elige derecha (porque 2 es mayorquecero).

    Jugador 2

    Izquierda Centro Derecha

    Alta 1,0 1,2 0,1

    0,3 0,1 2,0Jugadorl

    Baja

    Figura 1.1.1

    Sin embargo, para el jugador 2, derecha esta estrictamente dominadapor centro (porque 2 es mayor que 1 y 1 es mayor que 0), por 10 que unjugador racional 2 no elegira derecha. Asi, si el jugador 1 sabe que eljugador 2 es racional, puede eliminar derecha del espacio de estrategiasdel jugador 2. Esto es, si el jugador 1 sabe que el jugador 2 es racional,puede comportarse en el juego de la figura 1.1.1 como si estuviera en eljuego de la figura 1.1.2.

    [ugador 2

    Izquierda Centro

    Alta 1,21,0

    0,1Jugador 1

    Baja 0,3

    Figura 1.1.2

    En 1a figura 1.1.2, baja esta ahora estrictamente dominada por altapara e1jugador 1, as! que si e1jugador 1 es raciona1 (y el jugador 1 sabeque el jugador 2 es racional, por 10que se aplica e1juego de 1afigura 1.1.2)no elegira baja. Por eso, si e1jugador 2 sabe que el jugador 1 es racional,y el jugador 2 sabe que e1 jugador 1 sabe que el jugador 2 es racional(por 10 que el jugador 2 sabe que se aplica la figura 1.1.2), el jugador 2puede eliminar baja del espacio de estrategias del jugador 1, quedando eljuego como indica la figura 1.1.3. Pero ahora, izquierda esta estrictamentedominada por centro para el jugador 2, quedando (alta, centro) como elresultado del juego.

  • Teorfa bdsica: Juegos en formal normal y equilibria de Nash / 7

    Jugador 2

    Izquierda Centro

    Jugador 1 Alta 1L-_1_,0_--L-_1_,2___J

    Figura 1.1.3

    oj

    Este proceso se denomina eliminacion iterativa de las estrategias estric-tamente dominadas. Aunque esta basado en la atractiva idea de que losjugadores racionales no utilizan estrategias estrictamente dominadas, elproceso presenta dos inconvenientes. En primer lugar, cada paso requiereun supuesto adicional sobre 10 que los jugadores saben acerca de la ra-cionalidad del otro. Si queremos ser capaces de aplicar el proceso paraun mimero arbitrario de pasos, necesitamos suponer que es informaciondel dominio publico que los jugadores son racionales. Esto es, necesitamossuponer no s6lo que todos los jugadores son racionales, sino tambien quetodos los jugadores saben que todos los jugadores son racionales, y quetodos los jugadores saben que todos los jugadores saben que todos losjugadores son racionales, y as! ad infinitum (vease la definici6n formal deinformaci6n del dominic publico en Aumann [1976]).

    La segunda desventaja de la eliminaci6n iterativa de estrategias estric-tamente dominadas es que el proceso conduce a menudo a una predicci6nimprecisa sobre el desarrollo del juego. Por ejemplo, consideremos eljuego de la figura 1.1.4. En este juego no hay estrategias estrictamente do-minadas .para ser eliminadas. (Puesto que no hemos fundamentado estejuego en absoluto, allector puede parecerle arbitrario 0 incluso patol6gico.Para una aplicaci6n econ6mica en el mismo sentido, vease el caso de treso mas eD;l.presasen el modele de Cournot incluido en la secci6n 1.2.A.)Puesto que todas las estrategias en el juego sobreviven a la eliminaci6niterativa de las estrategias estrictamente dominadas, el proceso no permiteninguna predicci6n sobre el desarrollo del juego.

    leDA

    M

    B

    0,4 4,0 5,34,0 0,4 5,33,5 3,5 6,6

    Figura 1.1.4

  • 8/ JUEGOS ESTATICOS CON INroRMA06N COMPLETA (c. 1)

    A continuacion abordamos el equilibrio de Nash, un concepto de.so-lucion que da lugar a predicciones mucho mas precisas en una clase dejuegos muy amplia. Demostramos que el equilibrio de Nash es un con-cepto de soluci6n mas poderoso que la eliminacion iterativa de las estra-tegias estrietamente dominadas, en el sentido de que las estrategias de losjugadores en un equilibrio de Nash siempre sobreviven a la eliminaci6niterativa de las estrategias estrictamente dominadas, cosa que no ocurrea la inversa. En los capftulos siguientes argumentaremos que, en juegosmas ricos, incluso el equilibrio de Nash da lugar a predicciones demasiadoimprecisas sobre el desarrollo del juego, por 10 que definiremos nocionesde equilibrio aun mas poderosas, mas adecuadas para estos casos.

    1.I.e Fundamentacion y definicion del equilibrio de Nash

    Una manera de fundamentar la definicion del equilibrio de Nash es elargumento de que si la teorfa de juegos ofrece una solucion iinica a undeterminado problema, esta soluci6n debe ser un equilibrio de Nash enel siguiente sentido: Supongamos que la teona de juegos hace una unicapredicci6n sobre las estrategias elegidas P?r los jugadores. Para que estapredicci6n sea correcta es necesario que cada jugador este dispuesto aelegir 1a estrategia predicha por la teoria, Por ello, la estrategia predi-cha de cad a jugador debe ser la mejor respuesta de cada jugador a lasestrategias predichas de los otros jugadores. Tal prediccion puede deno-minarse estraiegicamente estable 0 self-enforcing, puesto que ningun jugadorva a querer desviarse de la estrategia predicha para el. Llamaremos a talprediccion equilibrio de Nash:

    Definicion. En el juego en forma normal de n jugadores, G = {SI,'" ,Sn; Ul,... ,Un}, las estrategias si, ... ,s~) forman un equilibria de Nash si, para cadajugador i, si es la mejor respuesta del jugador i (0 al menos una de ellas) a lasestrategias de los otros n - 1jugadores, (si, .. ,8;_1,8:+1" .. ,s~):

    para cada posible estrategia 8i en Si; esto es, 8i es una solucion de

  • Teoria basica: Juegos en formal normal y equilibria de Nash / 9

    Para relacionar esta definici6n con su fundamentaci6n anterior, su-pongamos que la teorfa de juegos ofrece las estrategias (sl/ ,s~) comola soluci6n al juego en forma normal G = {Sv ... ,SniUl, ,un}. Decirque (sl, ... ,s~) no constituyen un equilibrio de Nash de G es equivalentea decir que existe algUn jugador i tal que s~ no es la mejor respuesta a(sl, .. ,S~_l,s~+l' .. ,s~). Esto es, existe alguna s~'en S, tal que

    ASl, si la teorfa ofrece las estrategias (s1' ... ,s~) como la soluci6n pero estasestrategias no constituyen un equilibrio de Nash, al menos un jugadortendra un incentivo para desviarse de la predicci6n de la teoria, con 10que la teorfa quedara desmentida por el desarrollo concreto del juego.Otra fundamentaci6n muy parecida del equilibrio de Nash incorpora laidea ~e convenio: si surge un acuerdo sobre como comportarse en undeterminado juego, las estrategias fijadas por el convenio deben formarun equilibrio de Nash; si no, habra al menos un jugador que no se regirapor el convenio. .

    Para concretar, vamos a resolver unos cuantos ejemplos. Considere-mos los tres juegos en forma normal ya descritos: el dilema de los presosy los de las figuras 1.1.1. y 1.1.4. Una forma torpe de hallar los equili-brios de Nash en un juego consiste simplemente en comprobar si cadacombinaci6n posible de estrategias satisface la condici6n (EN) en la defi-nici6n.3 En un juego de dos jugadores, esta forma de hallar los equilibrioscomienza del modo siguiente: para cada jugador y para cada estrategiaposible con la que cuenta cada jugador se determina la mejor respuestadel otro jugador a esa estrategia. En la figura 1.1.5 se representa esto enel caso del juego definido en 1.1.4, subrayando la ganancia de la mejorrespuesta del jugador j a cada una de las posibles estrategias del jugadori. Si el jugador columna fuera a jugar I, por ejemplo, la mejor respuestadel jugador fila serfa M, puesto que 4 es mayor que 3 y que Oi por ello,la ganancia que 4 le proporciona al jugador fila en la casilla (M,l) de lamatriz binaria esta subrayada.

    3 En la secci6n 1.3.A vamos a distinguir entre estrategias puras y mixtas. Despues v~osa ver que la definici6n dada aquf describe equilibrios de Nash en estrategias puras, peroque tambien puede haber equilibrios de Nash en estrategias mixias. A menos que se sefialeexplicitAmente de otro modo, todas las referencias a los equilibrios de Nash en esta secci6n serefieren a equilibrios de Nash en estrategias puras.

  • 10 / JUEGOS ESTATICOS CON INFORMA06N COMPLETA (c. 1)

    Un par de estrategias satisface la condicion (EN) si la estrategia decada jugador es la mejor respuesta a la del otro, es decir, si ambas ganan-cias estan subrayadas en la casilla correspondiente de la matriz binaria.Por ella (B,D) es el unico par de estrategias que satisface (EN). Lo mismoocurre para (confesar, confesar) en el dilema de los presos y para (alta, cen-tro) en la figura 1.1.1. Estos pares de estrategias son los unicos equilibriosde Nash de estos juegos."

    leD ..A

    M

    B

    0,1 1,0 5,31,0 0,1 5,33,5 3,5 Q_Q

    Figura 1.1.5

    A continuacion tratamos la relacion entre el equilibrio de Nash y la

    eliminacion iterativa de las estrategias estrictamente dominadas. Recor-demos que las estrategias de equilibrio de Nash en el dilema de "lospresosy enla figura 1.1.1-(confesar, confesar) y (alta, centro) respectivamente-son las unicas estrategias que sobreviven a la eliminacion iterativa de lasestrategias estrictamente dominadas. Este resultado puede generalizarse:si la eliminaci6n iterativa de las estrategias estrictamente dominadas eli-mina todas las estrategias menos las estrategias (sj, ... ,s~), estas estrate-gias constituyen el unico equilibrio de Nash del juego. (Vease el apendicepara una demostracion de' esta afirmacion.) Sin embargo, puesto que laeliminacion iterativa de las estrategias estrictamente dominadas con fre-cuencia no elimina mas que una combinacion de estrategias, es del maximointeres el hecho de que el equilibrio de Nash sea un concepto de solucionmas poderoso que la eliminaci6n iterativa de las estrategias estrictamentedominadas en el siguiente sentido: si las estrategias si, ... ,s~ constituyenun equilibrio de Nash, sobreviven a la eliminacion iterativa de las estra-tegias estrictamente dominadas (vease apendice para una demostracion),pero pueden existir estrategias que sobrevivan ala eliminacion iterativa deestrategias estrictamente dominadas pero que no formen parte de ningun

    4 Esta afirmaci6n es correcta incluso si no limitamos nuestra atenci6n al equilibrio de Nashen estTategias puras, puesto que en estos juegos no existen equilibrios de Nash en estrategiasmixtas. Vease el ejercicio 1.10.

  • Teoria btfsiea: Juegos
  • 12 / JUEGOS ssrxncos CON INFORMA06N COMl'LETA (C. 1)

    Pat

    Opera Boxeo

    ChrisOpera 2,1 0,0

    Boxeo 0,0 1,2

    La batalla de los sexos

    Ambos, (6pera, 6pera) y (boxeo, boxeo) son equilibrios de Nash.Hemos argumentado antes que si la teoria de juegos ofrece una unica

    soluci6n a un juego, esta debe ser un equilibrio de Nash. Este argumentoignora la posibilidad de juegos en los cuales la teoria de juegos no ofreceuna soluci6n unica. Tambien hemos argumentado que si se llega a unacuerdo sobre c6mo comportarse en un juego, las estrategias establecidosen el acuerdo deben ser un equilibrio de Nash, pero este argumento, aligual que el anterior, ignora la posibilidad de juegos para los cuales no sealcance un acuerdo. En algunos juegos con multiples equilibrios de Nashsobresale un equilibrio como la soluci6n mas atractiva del juego. (Granparte de la teoria de los capitulos posteriores constituye un esfuerzo paraidentificar este equilibrio mas atractivo en diferentes clases de juegos.)Asf, la existencia de multiples equilibrios de Nash no es un problema ensf mismo. Sin embargo, en la batalla de los sexos, (6pera, 6pera) y (boxeo,boxeo) parecen igualmente atractivos, 10 que indica que pueden existirjuegos para los cuales la teoria de juegos no ofrece una soluci6n unica yen los que no se llegara a ningun acuerdo.f En tales juegos, el equilibriode Nash pierde gran parte de su atractivo como predicci6n del juego.

    6 En la secci6n 1.3.B describimos un tercer equilibrio de Nash (que incluye estrategiasmixtas) en la batalla de los sexos. Al contra rio que (6pera,6pera) y (boxeo.boxeo), este tercerequiUbrio ofrece ganancias simetricas, como se podrta esperar de la soluci6n unica a un juegosimetrico, Por otro lado, el tercer equilibrio es tambien ineficiente, 10 cual puede influir encontra de que se llegue a un acuerdo para alcanzarlo. Cualquiera que sea nuestro juicio sobrelos equilibrios de Nash en la batalla de los sexes, la cuesti6n sigue en pie: pueden existirjuegos para los cuales la teorfa de juegos no ofrezca una soluci6n unica y para los que no sellegue a ningtin acuerdo.

  • Teoria btisica: Juegos en formal normal y equilibria de Nash / 13

    Apendice

    Este apendice contiene demostraciones de las dos proposiciones siguientes,que fueron enunciadas de manera informal en la secci6n 1.1.C. Saltarseestas demostraciones no impedira de forma sustancial la comprensi6ndel resto dellibro. Sin embargo, para aquellos lectores no acostumbra-dos a la manipulaci6n de definiciones form ales y a la construcci6n dedemostraciones, el dominic de estas demostraciones constituye un va-lioso ejercicio.

    Proposicion A. En el juego en forma normal con n jugadores G = {SI,""Sn; UI, ... ,Un}, si la eliminaci6n iterativa de las estrategias estrictamente domi-nadas elimina todas las estrategias menos las (si, ... ,s~), estas ultimas esirategiasconstituyen el unico equilibria de Nash del juego.

    Proposicion B. En el juego en forma normal con n jugadores G = {S1,' .. ISn;U1,... ,Un}, si las estrategias (sj, ... ,s~) forman un equilibria de Nash, entoncessobreviven a la eliminaci6n iterativa de las estrategias estrictamente dominadas.

    Puesto que la proposicionB es mas facil de demostrar, comenzamospor ella para entrar en materia. El argumento es por contradicci6n.Esto es, vamos a suponer que una de las estrategias en un equilibriode Nash es eliminada por eliminaci6n iterativa de las. estrategias estric-tamente dominadas, y despues demostraremos que llegariamos a unacontradicci6n si este supuesto ocurriera, demostrando asf que el supuestodebe ser falso.

    Supongamos que las estrategias (si, ... ,s~) forman un equilibrio deNash del juego en forma normal G = {SI," "Sn;UI,'" ,un}, pero supon-gamos tambien que (tal vez despues de que algunas estrategias distintasde (si, ... ,s~) hayan side eliminadas) si es la primera de las estrategias(si,' .. ,s~) en ser eliminada por ser estrictamente dominada. Entonces,debe existir una estrategia s~'que no ha side aun eliminada de S, quedomina estrictamente a si. Adaptando (DE) tenemos

    (1.1.1)

    para cada (S1,' .. ,Si-1,Si+1,' .. ,sn) que puede ser construida a partir de lasestrategias que no han side aun eliminadas de los espacios de estrategiasde los otros jugadores. Puesto que si es la primera de las estrategias de

  • 14/ JUEGOSESTATICOSCON lNFORMA06NCOMPLETA (c. 1)

    equilibrio en ser eliminada, las estrategias de equilibrio de otros jugadoresno han sido eliminadas, por 10 que una de las consecuencias de (1.1.1).es

    (1.1.2)

    Pero (1.1.2) es contradicha por (EN): s: debe ser una mejor respuesta a( .. .... *) I de exi tir t t . 11sl"" ,Si_l,Si+l"" .s .. r por 0 que no pue e exis una es ra egIa Si quedomine estrictamente a s:. Esta contradicci6n completa la demostraci6n.

    Despues de haber demostrado la proposici6n Bhemos ya demostradoparte de la proposici6n Ai 10 unico que nos queda demostrar es que sila eliminaci6n iterativa de estrategias estrictamente dominadas eliminatodas las estrategias excepto (81', ... ,s~), estas estrategias forman un equi-librio de Nash. Por la proposici6n B cualesquiera otros equilibrios deNash habrian sobrevivido tambien, por 10 que este equilibrio debe serunico. Suponemos aquf que G es finito.

    EI argumento es nuevamente por contradicci6n. Supongamos quela eliminaci6n iterativa de estrategias estrictamente dominadas eliminatodas las estrategias excepto (si, ... ,8~),pero estas estrategias no formanun equilibrio de Nash. Entonces debe existir un jugador i y alguna estra-tegia factible Si en Si tal que (EN) no se cumpla, pero s, debe haber sidoestrictamente dominada por alguna otra estrategia 8~ en algun punto delproceso. Los enunciados formales de estas dos observaciones son: existes, en S, tal que

    (1.1.3)

    y existe s~ en el conjunto de estrategias del jugador i que queda en algunpunto del proceso tal que

    (1.1.4)

    para cada (Sl, ... ,Si-1,Si+l,' .. .e .. ) que puede ser construida a partir de lasestrategias que quedan en los espacios de estrategias de los otros jugadoresen ese punto del proceso. Puesto que las estrategias de los otros jugadores(sl" .. ,8:_1,S:+1" .. ,s~) nunca son eliminadas, una de las implicaciones de(1.1.4) es

    (1.1.5)

  • Aplicaciones / 15

    Si s~ = si (es decir, si si es la estrategia que domina estrictamente a Si)(1.1.5) contradice a (1.1.3), en cuyo caso la demostracion esta completa. Sis~ of si alguna otra estrategia si' debe mas tarde dominar estrictamente as~,ya que s~no sobrevive al proceso. Por eso,las desigualdades analogasa (1.1.4) y (1.1.5) se cumplen para s~y si', que sustituyen a Si y si respec-tivamente. Una vez mas, si si' = si la demostracion esta completa; si no,pueden construirse otras dos desigualdades analogas. Puesto que si esla unica estrategia de Si que sobrevive al proceso, la repeticion de esteargumento (en un juego finito) completa finalmente la demostracion,

    1.2 Aplicaciones

    1.2.AModelo de duopolio de Coumot

    Como hemos indicado en la seccion previa, Cournot (1838) se anticipoa la definicion de equilibrio de Nash en mas de un siglo (pero solo enel contexto de un modele concreto de duopolio). Por ello, no es sor-prendente que el trabajo de Cournot constituya uno de los clasicos de lateorfa de juegos y una de las piedras angulares en organizacion industrial.Consideramos aquf una version muy simple del modele de Cournot ypresentaremos variaciones del modele en los capftulos siguientes. En estaseccion utilizamos el modelo para ilustrar: (a) la traducci6n del enunciadoinformal de un problema a la forma normal de un juego; (b) los calculosnecesarios para hallar el equilibrio de Nash del juego y (c) la eliminacioniterativa de las estrategias estrictamente dominadas.

    Sean ql y q2 las cantidades (de un producto homogeneo) producidaspor las empresas 1 y 2 respectivamente. Sea P(Q) = a - Q el preciode equilibrio de mercado cuando la cantidad agregada en el mercado esQ = ql + q2 (Mas precisamente, P(Q) = a - Q para Q < a y P(Q) = 0 paraQ 2:: a.) Supongamos que el coste total de produccion de la cantidad qipor la empresa i es Ci(qi) = cqi. Es decir, no existen costes fijos y el costemarginal es constante e igual a c. donde suponemos que c < a. Siguiendoa Cournot, suponemos que las empresas eligen sus cantidades de formasimultanea."

    7 En la secci6n 1.2.B discutimos el modelo de Bertrand (1883), en el cuallas empresaseligen precios en vez de cantidades, y en la secci6n 2.1.B el modelo de Stackelberg (1934), enel cuallas empresas eligen cantidades, pero una empresa elige antes que (yes observada por)la otra. Finalmente, discutimos en la secci6n 2.3.C el modele de Friedman (1971), en el cuallainteracci6n descrita en el modele de Coumot ocurre repetidamente en el tiempo.

  • 16/ JUEGOS ESTAncos CON INR>RMA06N COMPLETA (C. 1)

    Para encontrar el equilibrio de Nash en el juego de Cournot, primerotraducimos el problema a un juego en forma normal. Recordemos dela secci6n anterior que la representaci6n en forma normal de un juegoexige precisar: (1) los jugadores en el juego; (2) las estrategias de quedispone cada jugador y (3) las ganancias recibidas por cada jugador concad a combinaci6n de estrategias posibles. Hay dos jugadores en un juegode duopolio: las dos empresas. En el modelo de Coumot las estrategiasde que dispone cada empresa son las diferentes cantidades que puedeproducir. Vamos a suponer que el producto es continuamente divisible.Naturalmente, no puede haber producci6n negativa. Por ello, el espaciode estrategias de cada empresa puede ser representado como Si = [0,00),los mimeros reales no negativos, en cuyo caso una estrategia tipica s, esla elecci6n de una cantidad qi 2: O.Se podria argumentar que no se puededisponer de cantidades demasiado grandes, por 10 que estas no deberianincluirse en el espacio de estrategias de una empresa. No obstante, puestoque P(Q) = 0 para Q 2: a, ninguna empresa producira una cantidad qi > a.

    Quedan por concretar las ganancias de la empresa i en funci6n de lasestrategias elegidas por dicha empresa y por la otra empresa, y definiry hallar el equilibrio. Suponemos que las ganancias de la empresa sonsimplemente su beneficio. Por ello, la ganancia 'Ui(Si,Sj) en un juego ge-neral en forma normal de dos jugadores puede expresarse de la siguienteforma:8

    Recordemos de la secci6n previa que, en un juego en forma normal dedos jugadores, el par de estrategias (sj,si) forma un equilibrio de Nash si,para cada jugador i,

    (EN)

    para cada posible estrategia 8. en Si. De la misma forma, para cadajugador i, si debe ser una soluci6n del problema de optimizaci6n

    8 Observese que hemos cambiado ligeramente la notaci6n aJ escribir 'I.Ii(8i,8;) en vezde 'U.(81,82). Ambas expresiones representan las ganancias del jugador i en funci6n de lasestrategias elegidas por todos los jugadores. Vamos a utilizar estas expresiones (y sus analogascon n jugadores) indistintamente.

  • Aplicaciones / 17

    En el modelo de duopolio de Cournot, el enunciado analogo es que el par ~ -: 0de cantidades (qj ,qi) forma un equilibrio de Nash si, para cada empresa ~ 4 -' Ci, qi es una soluci6n de ~ i\ _a ..~s.': -

    ""'l ~( .. 6i~~ ~. \max 7ri(qi,qj) = max qi[a - (qi + q;) - c). (8 ".Co

    O~q;

  • 18 / JUEGOS ESfAncos CON lNFORMA06N COMPLETA (C. 1)

    tentaci6n de aumentar 1aproducci6n queda reducida justo 10preciso para. que cada empresa decida no hacerlo, al darse cuenta de que con ella caerael precio de equilibrio de mercado. Vease el ejercicio 1.4 para un analisisde c6mo 1a presencia de un numero n de oligopolistas afecta al dilemaplanteado en equilibrio por la tentaci6n de aumentar la producci6n y eltemor a reducir el precio de equilibrio de mercado.

    En vez de hallar de forma algebraica el equilibrio de Nash del juegode Cournot, se podria hallar grMicamente del modo siguiente: la ecuaci6n(1.2.1) proporciona 1amejor respuesta de 1a empresa i a la estrategia deequilibria de la empresa j, q;. Un razonamiento analogo conduce a 1amejorrespuesta de la empresa 2 a cualquier estrategia arbitraria de la empresaI, y 1a mejor respuesta de la empresa 1 a cualquier estrategia arbitrariade 1a empresa 2. Suponiendo que la estrategia de la empresa 1 cumpleql < a - c,la mejor respuesta de la empresa 2 es

    del mismo modo, si q2 es menor que a - c, la mejor respuesta de 1aempresa1es

    q2

    (0, a - c)

    (0, (a - c) /2)

    a - c) /2, 0) (a - c, 0)Figura 1.2.1

  • Aplicaciones / 19

    Como se muestra en la figura 1.2.1 estas dos funciones de mejor respuestase cortan s6lo una vez, en el par de cantidades de equilibrio (qi ,q2)'

    Un tercer modo de hallar este equilibrio de Nash es aplicar el procesode eliminacion iterativa de las estrategias estrictamente dominadas. Esteproceso ofrece una unica soluci6n que, por la proposici6n A del apendicede la secci6n anterior, debe ser un equilibrio de Nash (qi ,ql) EI proceso n. ~completo requiere un numero infinito de pasos, cada uno de los cuales bL'\,J.elimina una fracci6n de las cantidades que quedan en el espacio de es- e -v()trategias de cada empresa. Vamos a discutir solamente los dos primeros Vpasos. Enprimer lugar, la cantidad de monopolio qm = (a - c)/2 dominaestrictamente a cualquier cantidad mas alta. Es decir, para cada x > 0,1fi(qm,qj) > 7ri(qm + x,qj) para toda qj 2: O. Para comprobarlo, n6tese queQ = qm + X + qj < a, por 10que

    y

    Y si Q = qm + X + qj 2: a, entonces P(Q) = 0, por 10 que producir unacantidad menor aumenta el beneficio. En segundo lugar, puesto quelas cantidades mayores que qm han sido eliminadas, la cantidad (a -c)/4 domina estrictamente a cualquier cantidad mas baja. Esto es, paracualquier x entre cero y (a - c)/4, 1fi[(a - c)/4,qj] > 1fi[(a - c)/4 - x,qj] paracualquier qj entre cero y (a - c)/2. Para comprobarlo, n6tese que

    . (a-c .) _ ~ [3(a-c) _ .J1f~ 4 ,qJ - 4 4 qJ

    y

    (a - c ) [a - c J [3(a - c) J1ft -4- - x,qj = -4- - x 4 + x - qj

    [a - c ]=7ri(qm,qj) - X -2- + x - qj .

    Tras estos dos pasos, las cantidades que quedan en el espacio de estrategiasde cada empresa son las contenidas en el intervalo entre (a - c)/4 y (a - c)/2.La repetici6n de estos argumentos conduce a intervalos cada vez menores

  • 20/ JUEGOS ESTATICOS CON INFORMACI6N COMPLETA (c. 1)

    de las eantidades que quedan. En ellimite, estos intervalos eonvergen alunico punto q; = (a - c)/3.

    La elirninaci6n iterativa de las estrategias estrietamente dominadastambien se puede representar en forma grafica utilizando la observacion(incluida en la nota 1; vease tambien la discusi6n en la secci6n 1.3.A) deque una estrategia es estrietamente dominada si y solo si no existe ningunaeonjetura sobre las decisiones posibles de los demas jugadores para la eualsea la mejor respuesta Puesto que s6lo hay dos empresas en este modelo,podemos reformular esta observaci6n del siguiente modo: una eantidadqi es estrietamente dominada si y s6lo si no hay ninguna eonjetura sobre qjtal que qi sea la mejor respuesta de la empresa i. Nuevamente, discutimossolo los dos primeros pasos del proeeso iterativo. En primer lugar, nuneaes una respuesta mejor para la empresa i producir mas que la cantidad demonopolio qm = (a - c)/2. Para eomprobarlo, eonsideremos, por ejemplo,la funcion de mejor respuesta de la empresa 2: en la figura 1.2.1, R2(ql)es igual a qm cuando ql = 0, y disminuye euando ql aumenta. ASl, paraeualquier qj ~ 0, si la empresa i cree que la empresa j elegira ss. la mejorrespuesta de la empresa i es menor que 0 igual a qm. No existe qj tal quela mejor respuesta de la empresa i sea mayor que qm. En segundo lugar,dada esta cota superior para la eantidad de la empresa j, podemos derivaruna cota mas baja a la mejor respuesta de la empresa i: si qj ~ (a - c)/2,entonees ~(qj) ~ (a - c)/4, como mostramos para la mejor respuesta dela empresa 2 en la figura 1.2.2.9

    q,

    (0, (a - c)/2)

    (0, (a - c) /4) ----...-----....-------:

    a - c) /2,0) (a - c, 0)

    Figura 1.2.2

    9 Estos dos argumentos son ligeramente incompletos, puesto que no hemos analizadoIa mejor respuesta de Ia empresa i cuando no tiene la certeza de cual sea la cantidad qj.Supongamos que Ia empresa i no esta segura de qj pero cree que el valor esperado de qjes E(qj). Puesto que 1I'i(Qi,qj) es lineal en qj' la mejor respuesta de la empresa i dentro desu incertidumbre es igual a su mejor respuesta cuando tiene la certeza de que 1a empresa jelegira E(qj), caso que hemos desarrollado en el texto.

  • Aplicacicmes / 21

    Como en el caso anterior, la repetici6n de estos argumentos conduce a lacantidad qi = (a - c)/3.

    Concluimos esta secci6n cambiando el modelo de Coumot, de formaque la eliminaci6n iterativa de las estrategias estrictamente dominadas noofrezca una soluci6n unica. Para hacerlo, aiiadimos simplemente una 0mas empresas al duopolio existente. Vamos a comprobar que el primerode los dos pasos discutidos en el caso del duopolio continua cumpliendose,pero el proceso termina am. Por eso, cuando hay mas de dos empresas,la eliminaci6n iterativa de las estrategias estrictamente dominadas ofreces6lo la prediccion imprecisa de que la cantidad de cada empresa no ex-cedera a la cantidad de monopolio (como en la figura 1.1.4, donde no seeliminaba ninguna estrategia durante el proceso).

    Para ser mas concretes, consideramos el caso de tres empresas. SeaQ-i la suma de las cantidades elegidas por las empresas distintas de i, ysea 1l'i(qi,Q-i) = qi(a - qi - Q -i - c) siempre que qi+Q -i < a (mientras que1l'i(qi,Q-i) = -cqi si qi + Q-i ~ a). Nuevamente es cierto que la cantidadde monopolio qm = (a - c)/2 domina estrictamente cualquier cantidadmas alta. Es decir, para cualquier x > 0, 1l'i(qm,Q-i) > 1l'i(Qm+ X,Q-i)para todo Q-i ~ 0, como en el primer paso del caso de duopolio. Sinembargo, puesto que hay dos empresas ademas de la empresa i, 10 unicoque podemos decir acerca de Q-i es que esta entre cero y (a - c), porque qjy qk estan entre cero y (a - c)/2. Pero esto implicaque ninguna cantidadqi ~ 0 es estrictamente dominada en el caso de la empresa i, porque paracada qi entre cero y (a - c)/2 existe un valor de Q-i entre cero y (a - c)(concretamente, Q-i = a - c - 2qi), tal que qi es la mejor respuesta de laempresa i a Q _i. Por ello, en 10 sucesivo ya no se puede eliminar ningunaestrategia.

    1.2.B Modelo de duopolio de Bertrand

    A. continuaci6n consideramos un modelo diferente de la relaci6n quepuede existir entre dos duopolistas, basado en la sugerencia de Bertrand(1883) de que, de hecho, las empresas eligen precios, y no cantidadescomo en el modele de Cournot. Es importante observar que el modele deBertrand constituye un juego diferente al modele de Coumot: los espaciosde estrategias son diferentes, las funciones de ganancias son diferentesy (como se vera) el comportamiento de los equilibrios de Nash en losdos modelos es diferente. Algunos autores resumen estas diferencias ha-blando de los equilibrios de Coumot y de Bertrand. Pero esto puede crear

  • 22/ JUEGOS ssrxncos CON INFORMACI6N COMPLETA (c. 1)

    confusiones, puesto que existen diferencias entre los juegos de Bertrandy Coumot y en el comportamiento de equilibrio en estos juegos, pero noexiste diferencia en el concepto de equilibrio utilizado en ambos juegos.En ambos el concepto de equilibrio utilizado es el equilibrio de Nash definido enla seccion anterior.

    Consideremos el caso de productos diferenciados. (Para el caso deproductos homogeneos vease el ejercicio 1.7.) Si las empresas 1 y 2 eligenlos precios P1 y 1>2 respectivamente, la cantidad demandada a la empresai por los consumidores es

    ..

    donde b > 0 refleja hasta que punto el producto de la empresa i es unsustituto del producto de la empresa j. (Esta es una funci6n de demandairreal, puesto que la cantidad demandada del producto de la empresai es positiva incluso cuando la empresa i fija un precio arbitrariamentealto, siempre que la empresa j tambien fije un precio suficientementealto. Como se vera, el problema solo tiene sentido si b < 2.) Como enla discusion del modelo de Coumot, suponemos que no existen costesfijos de produccion y que los costes marginales son constantes e igualesa c, donde c < a y las empresas deciden (por ejemplo, eligen los precios)simultaneamente.

    Como antes, la primera tarea en el proceso de hallar el equilibrio deNash es traducir el problema a un juego en forma normal. Tenemosdos jugadores nuevamente. Sin embargo, esta vez las estrategias de quedispone cada empresa son los diferentes precios que pueden fijar, envez de las diferentes cantidades que pueden producir. Vamos a suponerque los precios negativos no son factibles, pero que cualquier precio nonegativo 10 es; por ejemplo, no existe ninguna restriccion a los preciosexpresados en centimos. Asf, el espacio de estrategias de cada empresapuede ser nuevamente representado como Si = [0,00), los mimeros realesno negativos, y una estrategia tipica s, es ahora la decisi6n de un precioPi ~ O.

    Vamos a suponer nuevamente que la funci6n de ganancias de cadaempresa es simplemente su beneficio. El beneficio de la empresa i cuandoelige el precio Pi y su rival elige el precio Pj es

    1f'i(Pi,Pj) = qi(Pi,Pj)[Pi - c] = [a - Pi + bpj][Pi - c].Ast, t::1 par de precios (pi,pi) constituye un equilibrio de Nash si para cada

    ,- -"\_ '- ~.;.-\'0v'.:> ~ I....d\\ _ Q--- -d>'~,",

  • Apiicaciones / 23

    empresa i, pt es una soluci6n de

    max 7I"i(Pi,pj) = max [a - Pi + bpj][Pi - c).O::;Pi

  • W,

    x

    24/ JUEGOS ESTATICOS CON lNFoRMAcr6N COMPLETA (C. 1)

    Supongamos que las partes en disputa son una empresa y un sindicato,y que la disputa es acerca de los salarios. Supongamos que el juego sedesarrolla de la siguiente manera: primero, la empresa y el sindicato rea-lizan simultaneamente ofertas, denominadas We y W8 En segundo lugar,el arbitro elige una de las dos ofertas. (Como en muchos de los ~ama-dos juegos estaticos, esto es en realidad un juego dinamico del tipo quediscutiremos en el capitulo 2, pero aquf 10 reducimos a un juego estaticoentre la empresa y el sindicato al suponer una detenninada conducta delarbitro en la segunda etapa.) Supongamos que el arbitro tiene un acuerdoideal que le gustaria imponer, que denominamos x. Supongamos ademasque, tras observar las ofertas de las partes, We Yws , el arbitro elige sim-plemente la oferta mas cercana a z: siempre que We < WB (una intuicionque demostraremos que se cumple) el arbitro elige We si x < (We +Ws)/2 Yelige Ws si x> (We + ws)/2, como vemos en la figura 1.2.3. (Lo que ocurresi x = (we + ws)/2 es irrelevante; supongamos que el arbitro lanza unamoneda.)

    w, es elegida w, es elegida

    W,

    (W,+ w,) /2

    Figura 1.2.3

    EI valor de xes conocido por el arbitro, pero no por las p~es. Las par-tes creen que z se distribuye aleatoriamente segun una distribucion de pro-babilidad F(x), con la correspondiente funcion de densidad f(x).l1 Dadanuestra especificacion acerca del comportamiento del arbitro, si las ofertasson Wfr YWB, las partes creen que las probabilidades Prob{We sea elegida}YProb{ Ws sea elegida} pueden ser expresadas de la siguiente forma:

    11 Esto es, 1a probabilidad de que z sea menor que un valor arbitrario x es Ftx"),y 1a derivada de esta probabilidad con respecto a x es /(x). Puesto que F(x) es unaprobabilidad, tenemos que 0 ~ F(x) ~ 1 para cualquier x. Ademas, si x > x,F(x**) ~ F(x); entonces /(x) ~ 0 para cada x.

  • Aplicaciones / 25

    b{ I'} {We +We} (We +We)Pro Wee egido = Prob X < 2 = F 2y

    Prob{ weelegido} = 1 _ F (We; Ws) .Ast, el acuerdo salarial esperado es

    We . Prob{weelegido }+ws . Prob{ wselegido} =We' F (We; Ws) +Ws . [1 - F (We; Ws) ] .

    Suponemos que la empresa quiere minimizar el salario esperado impuestopor el arbitro y el sindicato quiere maximizarlo.

    Si el par de ofertas (w;,w;) ha de constituir un equilibrio de Nash deljuego entre la empresa y el sindicato, w; debe ser una soluci6n de12

    ~ We F ( We ; W;) +W; . [1 _ F ( We ; W; ) ]y w; debe ser una soluci6n de

    n;:.x w: .F (w; ; Ws ) + Ws . [1 _ F (w; ; Ws ) ] .Asf, el par de ofertas salariales (w;,w;) debe ser una soluci6n de las con-diciones de primer orden de estos problemas de optimizaci6n:

    (W; _ w:) . ~ f ( w; ; W;) = F (w; ; W;)y

    (W; - w:) . ~f (w; ; w;) = [1 _ F ( w; ; W;) ] .(Posponemos la consideraci6n de si estas condiciones de primer orden sonsuficientes.) Puesto que los terminos de la izquierda de estas condicionesde primer orden son iguales, los terminos de la derecha deben asimismoser iguales, 10 que implica que

    12AI formular los problemas de optimizaci6n de la empresa y el sindicato hemos supuestoque la oferta de la empresa es menor que la oferta del sindicato. Es inmediato demostrar queesta desigualdad se debe cumplir en equilibrio.

  • 26/ JUEGOS ESTATICOS CON INFORMACI6N COMPLETA (c. 1)

    F (W; +W;) =!.2 2' (1.2.2)esto es, la oferta media debe ser igual a la mediana del acuerdo preferidopor el arbitro. Sustituyendo (1.2.2) en cualquiera de las condiciones deprimer orden obtenemos

    (1.2.3)

    esto es, la distancia entre las ofertas debe ser igual a la inversa del valorde la funci6n de densidad evaluada en la mediana del acuerdo preferidopor el arbitro.

    Consideremos el siguiente ejemplo, que ofrece un resultado de estaticacomparativa que resulta intuitivamente atractivo. Supongamos que elacuerdo preferido por el arbitro se distribuye normalmente con media my varianza a2, en cuyo caso la funci6n de densidad es

    I(x) = _1_ exp { __ 1_(X _

  • Aplicaciones / 27

    La interpretaci6n de este equilibrio es simple. Cada parte se enfrentaa un dilema. Una oferta mas agresiva (es decir, una oferta mas bajapor parte de la empresa 0 una oferta mas alta por parte del sindicato)genera unas ganancias mayores si es elegida por el arbitro, pero es menosprobable que sea elegida. (Veremos en el capitulo 3 que un dilema similaraparece en una licitaci6n a pliego cerrado y al precio mas alto: una pujamas baja genera unas ganancias mayores si es la puja ganadora, peroreduce probabilidad de ganar.) Cuando hay mas incertidumbre sobre elacuerdo preferido por el arbitro (es decir, (12 es mas alta),las partes puedenpermitirse ser mas agresivas, puesto que una oferta agresiva tiene menosprobabilidades de ser muy diferente del acuerdo preferido por el arbitro.Por el contrario, cuando apenas hay incertidumbre, ninguna parte puedepermitirse hacer una oferta alejada de la media, porque es muy probableque el arbitro prefiera acuerdos cercanos a m.

    1.2.D EI problema de los ejidos

    Al menos desde Hume (1739), los fil6sofos politicos Y los economistashan entendido que si los ciudadanos responden unicamente a incentivosprivados, habra un deficit en la provisi6n de bienes publicos y los recursospublicos estaran sobreutilizados. Hoy en dia, basta con fijarse en el medioambiente para constatar la fuerza de esta idea. Fue el trabajo ampliamentecitado de Hardin (1968) el que fij61a atenci6n de los no economistas sobreel problema. A continuaci6n analizamos un ejemplo buc6lico.

    Consideremos los n habitantes de una aldea. Cada verano todos losaldeanos llevan sus cabras a pastar en el ejido de la aldea. Denominamos9i el numero de cabras que el i-esimo campesino posee y el ruimero totalde cabras en la aldea G = 91 + ... + 9n. El coste de comprar y euidar unacabra es c, independientemente de cuantas cabras se posean. El valor deeriar una cabra en el ejido cuando alli se concentra un total de G cabras esv(G) por cabra. Puesto que una cabra necesita al menos una cierta cantidadde pasto para sobrevivir, existe un ruimero maximo de cabras que puedenpastar en el ejido, Gmax:v(G) > 0 para G < GmaXl perc v(G) = 0 paraG ~ Gmax. Por otra parte, puesto que las primeras cabras disponen de unamplio espacio para pastar, afiadir una mas no afecta a las que ya estan alli,pero cuando hay tantas cabras pastando que apenas pueden sobrevivir(es decir, G esta justo por debajo de Gmax), afiadir una eabra mas afecta alas demas de forma dramatics. Formalmente: para G < Gmax1 v'(G) < 0

  • 28 / JUEGOS ESTATICOS CON INIQRMAcr6N COMPLETA (c. 1)

    y v"(G) < 0, como muestra la figura 1.2.4.

    v

    G

    Figura 1.2.4

    Durante la primavera, los aldeanos eligen simultaneamente cuantascabras van a tener. Supongamos que las cabras son continuamente divisi-bles. Una estrategia del aldeano i es la decisi6n sobre el numero de cabrasque llevara a pastar en el ejido, gi. Suponer que el espacio de estrategiases [0,00) cubre todas las opciones del aldeano; [O,Gmax) tambien bastaria.Las ganancias del aldeano ipor criar gi cabras cuando el mimero de cabrascriadas por otros aldeanos es gl,'" ,gi-1,gi+l ... ,gn, es

    0.2.4)

    Asi, si (gi, ... ,g:) ha de constituir un equilibrio de Nash, para cada i, g;debe maximizar (1.2.4) dado que los otros aldeanos eligen (g;, ... ,g:-I'g:+1" .. ,g:). La condici6n de primer orden de este problema de optimi-zaci6n es

    0.2.5)

    donde g~i denota g; + ... + g:-l + g:+1+ ... + g:. Sustituyendo g; en(1.2.5), sumando todas las condiciones de primer orden de los n aldeanosy dividiendo luego por n se obtiene

    v(G*) + !G*v'(G*) - c = 0,n

    0.2.6)

    donde G* denota g1 + ... +g:. Por el contrario, e16ptimo social, denotadocon G* , es una soluci6n de

  • Teoria avanzada: Estrategias mixias y existencia de equilibrio / 29

    max Gv(G) - Gc,O$G v'(G) ~ v'(G**), puesto que v" < O.Finalmente, G'" In < G"'*. ASl,el termino de la izquierda de (1.2.6) es estrictamente mayor que el termino de la izquierda de(1.2.7), 10 cual es imposible dado que ambos son iguales a cero.

  • 30/ JUEGOS ESTATICOS CON INFORMAOON COMPLETA (c. 1)

    Jugador 2

    Cara Cruz

    Cara -1,1 1,-1Jugador 1

    Cruz 1, - 1 -1,1

    El juego de las monedas

    En este juego el espacio de estrategias de cada jugador es {cara, cruz}.La historia que explica las ganancias en la matriz binaria es la siguiente:imaginemos que cada jugador tiene una moneda y debe elegit mostraruna cara de la moneda. Si las dos monedas coinciden, esto es, ambasmuestran la misma cara, el jugador 2 gana la moneda del jugador 1. Si lascaras de las monedas no coinciden entonces el jugador 1 gana la monedadel jugador 2. No existe ningun par de estrategias que pueda cumplir(EN), puesto que si las estrategias de los jugadores coinciden (cara, cara)o (cruz, cruz), el jugador 1 prefiere cambiar su estrategia, mientras que silas estrategias no coinciden (cara,cruz) 0 (cruz, cara), es el jugador 2 quienprefiere cambiar su estrategia.

    El rasgo distintivo de este juego es que a cada jugador Ie gustariaadivinar la jugada del otro y que el otro no adivinase la suya. Versionesde este juego tambien se dan en el p6quer, el beisbol, en las batallas y enotras situaciones. En el p6quer, la cuesti6n analoga es con que frecuenciatirarse un farol: si se sabe que el jugador i nunca se tira faroles, susoponentes pasaran siempre que i apueste de forma agresiva, haciendoque a i le convenga tirarse un farol de cuando en cuando. Por otraparte, tirarse faroles con demasiada frecuencia constituye una estrategiaperdedora. En beisbol, supongamos que ellanzador puede Ianzar la bolao bien de forma rapida 0 bien describiendo una curva, y que el bateadorpuede darle a cualquiera de ellas si (y s6lo si) la preve correctamente, Deforma similar, en una batalla, podemos suponer que los atacantes puedenelegit entre dos objetivos (0 dos rutas, como por tierra 0 por mar), y quela defensa puede rechazar cualquiera de los dos ataques si (y s6lo si) estees previsto de forma correcta.

    En cualquier juego en el cual a cada jugador Ie convenga adivinar Iajugada del otro y que el otro no adivine la suya, no existe ningiin equili-brio de Nash (al menos tal como este concepto de equilibrio se definio enla secci6n 1.1.C), porque la soluci6n de tal juego inc1uye necesariamente

  • Teorla avanzada: Estrategias mixias y exisiencia de equilibrio / 31

    un elemento de incertidumbre sobre 10 que harem los jugadores. A conti-nuaci6n, introducimos la noci6n de esiraiegia mixta, que interpretamos enterminos de la incertidumbre de un jugador respecto a 10que otro jugadorhara. (Esta interpretaci6n fue avanzada por Harsanyi [1973]; la discutire-mos con mas detalle en la secci6n 3.2.A.) En la proxima secci6n vamos aampliar la definicion de equilibrio de Nash para que incluya estrategiasmixtas, incorporando con ello el elemento de incertidumbre inherente a lasoluci6n de juegos como el juego de las monedas, del p6quer, del beisboly de las batallas.

    Formalmente, para el jugador i una estrategia mixta es una distri-buci6n de probabilidad sobre (algunas 0 todas) las estrategias en Si. Deaqui en adelante nos referiremos a las estrategias en S; como estrategiaspuras del jugador i. En los juegos con decision simultanea e informacioncompleta analizados en este capitulo, las estrategias puras de un jugadorson las diferentes decisiones que el jugador puede tomar. En el juego delas monedas, por ejemplo, Si consiste en las dos estrategias puras cara ycruz, as! que una estrategia mixta para el jugador i es la distribuci6n deprobabilidad (q,l - q), donde q es la probabilidad de elegir cara, 1 - q esla probabilidad de elegir cruz, y ~ q ~ 1. La estrategia mixta (0,1) essimplemente la estrategia pura cruz; del mismo modo, la estrategia mixta(1,0) es la estrategia pura cara.

    Como un segundo ejemplo de estrategia mixta, recordemos la figura1.1.1, en la que el jugador 2 cuenta con las estrategias puras izquierda,centro y derecha. En este caso. para el jugador 2 una estrategia mixta es ladistribuci6n de probabilidad (q,r,l - q - r), en la que q es la probabilidadde elegir izquierda, r es la probabilidad de elegir centro y 1 - q - r es laprobabilidad de elegir derecha. Como antes, ~q ~ 1, Yahora tambien ~ r ~ 1 Y0 ~ q + r ~ 1. En este juego la estrategia mixta (1/3,1/3,1/3)asigna la misma probabilidad a izquierda, centro y derecha, mientras que(1/2,1/2,0) asigna la misma probabilidad a izquierda y centro, pero noasigna ninguna probabilidad a derecha. Como siempre, las estrategiaspuras de un jugador son simplemente los casos limite de sus estrategiasmixtas (por ejemplo, aquf la estrategia pura izquierda del jugador 2 es laestrategia mixta (1, 0, 0.

    De forma mas general, supongamos que el jugador i cuenta con Kestrategias puras: S, = {Sil, ... ,Si!(}. En este caso, para el jugador iuna estrategia mixta es una distribucion de probabilidad (Pil, .. ,PU(), enla que Pik es la probabilidad de que el jugador i elija la estrategia Sik,para k = 1, ... ,K. Puesto que Pik es una probabilidad, es necesario que

  • Iugador 2

    I D

    32 I JUEGOS ESTATICOS CON lNFORMACl6N COMPLETA (c. 1)

    o ~ Pik ~ 1 para k = 1, ... ,K Y Pil + ... + PiI< = 1. Vamos a utilizarPi para denotar una estrategia mixta del conjunto de distribuciones deprobabilidad sobre Bi, del mismo modo que utilizamos Si para denotaruna estrategia pura de Bi.

    Definicion. En el juego en forma normal G = {B1, .. ,Bn;Ull" . ,Un} supon-gamos que S, = {Sil,'" ,SiI< }. En este caso para el jugador i una estrategiamixta es una distribuci6n de probabilidad Pi = (Pil, ... ,PU( ), donde 0 ~ Pik ~ 1para k = 1, ... ,K Y Pil + ... + PiI< = 1.

    Concluimos esta secci6n volviendo brevemente a la noci6n de es-trategias estrictamente dominadas que introdujimos en la secci6n 1.1.B,con objeto de ilustrar el papel potencial de las estrategias mixtas en losargumentos allf utilizados. Recordemos que si una estrategia 8i es estric-tamente dominada, no existe ninguna conjetura que el jugador i puedaformarse (sobre las estrategias que elegiran los demas jugadores) tal quehiciera 6ptimo elegir Si. El argumento inverso tambien se cumple, siem-pre que permitamos estrategias mixtas: si no existe ninguna conjetura que.el jugador i pueda formarse (sobre las estrategias que elegiran los demasjugadores) tal que hiciera 6ptimo elegir Si, existe otra estrategia que do-mina estrictamente a 8,.14 Los juegos de las figuras 1.3.1 Y 1.3.2 muestranque este argumento inverso seria falso si limitaramos nuestra atenci6n aestrategias puras.

    A

    Jugador 1 M

    B

    3,- 0,-0,- 3,-1,- 1,-

    Figura 1.3.1

    14 Pearce (1984) demuestra este resultado en el caso de dos jugadores, e indica que secumple para el caso de n jugadores siempre que las estrategias mixtas de los jugadores puedanestar correlacionadas. Es decir, siempre que 10 que suponga el jugador i sobre 10 que hadel jugador j pueda estar correlacionado con 10 que suponga el jugador i sobre 10 que had eljugador k, Aumann (1987) sugiere que tal correJaci6n en los supuestos de i es completamentenatural, incluso si j, i Y k toman sus decisiones de forma totalmente independiente: porejemplo, i puede saber que tanto j como k fueron a una escuela de direcci6n de empresas, 0incJuso a Ja misma escuela, pero puede no saber 10 que se ensefta en ella.

  • Tearia avanzada: Estrategias mixias y existencia de equilibrio / 33

    La figura 1.3.1 muestra que una estrategia pura dada puede estar es-trictamente dominada por una estrategia mixta, incluso si la estrategiapura no esta estrictamente dominada por ninguna otra estrategia pura.En este juego, para cualquier conjetura (q,1 - q) que el jugador 1 pudieraformarse sobre el juego del jugador 2, la mejor respuesta de 1 es 0 A(si q ~ 1/2) 0 M (si q ::; 1/2), pero nunca B. Sin embargo, B no estaestrictamente dominada ni por A ni por M. La clave es que B esta es-trictamente dominada por una estrategia mixta: si el jugador 1 elige Acon probabilidad 1/2 y M con probabilidad 1/2, la ganancia esperada de1es 3/2, independientemente de que estrategia (pura 0 mixta) utilice 2, y3/2 es mayor que el pago a 1 que produce con certeza la elecci6n de B.Este ejemplo ilustra el papel de las estrategias mixtas para encontrar "otraestrategia que domine estrictamente a 8/'.

    Jugador 2I D

    A

    Jugador 1 M

    B

    3,- 0,-

    0,- 3,-

    2,- 2,-

    Figura 1.3.2

    La figura 1.3.2 muestra que una estrategia pura dada puede ser unamejor respuesta a una estrategia mixta, incluso si la estrategia pura no esuna mejor respuesta a ninguna otra estrategia pura. En este juego, B noes una mejor respuesta para el jugador 1 a I 0D del jugador 2, pero B es lamejor respuesta del jugador 1 ala estrategia mixta (q,1 - q) del jugador 2,siempre que 1/3 < q < 2/3. Este ejemplo ilustra el papel de las estrategiasmixtas en la "conjetura que se puede formar el jugador i".

    1.3.B Existencia del equilibrio de Nash

    En esta secci6n discutimos varios temas relacionados con la existencia delequilibrio de Nash. En primer lugar, ampliamos la definici6n de equili-brio de Nash dada en la secci6n l.1.C para incluir las estrategias mixtas.En segundo lugar, aplicamos esta definici6n ampliada al juego de las mo-nedas y a la batalla de los sexos. En tercer lugar, utilizamos un argumentografico para demostrar que cualquier juego de dos jugadores en el cual

  • 34/ JUEGOS ESTATICOS CON INFORMA06N COMPLETA (c. 1)

    cada jugador cuenta con dos estrategias puras tiene un equilibrio de Nash(que posiblemente inc1uya estrategias mixtas). Finalmente, enunciamos ydiscutimos el teorema de Nash (1950), que garantiza que cualquier juegofinito (es decir, cualquier juego con un ruimero finito de jugadores, cadauno de los cuales cuenta con un ruimero finito de estrategias puras) tieneun equilibrio de Nash (que posiblemente incluya estrategias mixtas).

    Recordemos que la definici6n de equilibrio de Nash dada en la secci6n1.1.C garantiza que la estrategia pura de cada jugador constituye unamejor respuesta a las estrategias puras de los restantes jugadores. Paraampliar la definici6n de modo que incluya estrategias mixtas, necesita-mos simplemente que 1a estrategia mixta de cada jugador sea una mejorrespuesta a las estrategias mixtas de los otros jugadores. Puesto que cual-quier estrategia pura puede ser representada como la estrategia que asignauna probabilidad cero a todas sus otras estrategias puras, esta definici6nampliada incluye a la anterior.

    La forma de hallar la mejor respuesta del jugador i a una estrategiamixta del jugador j se basa en la interpretaci6n de la estrategia mixta deljugador j como representaci6n de la incertidumbre del jugador i sobre 10que hara el jugador j. Continuamos con el juego de las monedas comoejemplo. Supongamos que el jugador 1cree que el jugador 2 elegira caracon probabilidad q y cruz con probabilidad 1 - q; esto es, 1 supone que2 elegira la estrategia mixta (q,l - q). Bajo este supuesto, las gananciasesperadas del jugador 1 son q . (-1) + (1 - q) . 1 = 1 - 2q eligiendo cara yql + (1 - q). (-1) = 2q - 1 eligiendo cruz. Puesto que 1 - 2q > 2q -1 siYs610 si q < 1/2, la mejor respuesta en estrategias puras del jugador 1 escara si q < 1/2 Ycruz si q > 1/2, Yel jugador 1 sera indiferente entre caray cruz si q = 1/2. Nos quedan por considerar las estrategias rnixtas deljugador 1.

    Sea (r,1 - r) la estrategia mixta en la cual el jugador 1 elige cara conprobabilidad r. Para cada valor de q entre cero y uno, calculamos el(los)valor(es) de r, denotado(s) por r" (q) tal que (r,l-r) sea una mejorrespuestadel jugador 1 a (q,l - q) del jugador 2. Los resultados se recogen en lafigura 1.3.3. La ganancia esperada del jugador 1 al elegir (r,l - r) cuando2 elige (q,l - q) es l I )

    ~~{ ( ~~'1,rq-I; -l)+r(1-q)l +(1-r)qI +(1-r)(1-q)(-1) = (2q-l)+r(2-4q), (1.3.1)

    donde rq es la probabilidad de (cara, cara), r(I - q) la probabilidad de

  • Tear{a avanzada: Estrategias mixtas y existencia de equilibria / 35

    (cara, cruz), y asf sucesivamente.P Puesto que la ganancia esperada deljugador 1 es creciente en r si 2 - 4q > 0 y decreciente en r si 2 - 4q < 0,la mejor respuesta del jugador 1 es r = 1 (es decir, cara) si q < 1/2 Yr = 0(es decir, cruz) si q > 1/2, como indican los dos segmentos horizontalesde r*(q) en la figura 1.3.3. Esta afirmaci6n es mas poderosa que la afir-maci6n del parrafo anterior con la que esta estrechamente relacionada:en aquella considerabamos solamente estrategias puras y encontrabamosque si q < 1/2, cara era la mejor estrategia pura, y que si q > 1/2, cruzera la mejor estrategia pura. En esta consideramos todas las estrategias,puras y mixtas, pero encontramos nuevamente que si q < 1/2, cara es lamejor estrategia de todas (puras 0 mixtas), y que si q > 1/2, cruz es lamejor estrategia de todas.

    r

    r'(q)(Cara) 1 4 !

    (Cruz)1/2 1

    (Cara)

    q(Cruz)

    Figura 1.3.3

    La naturaleza de la mejor respuesta del jugador 1 a (q,l - q) cambiacuando q = 1/2. Como indicamos anteriormente, cuando q = 1/2 eljugador 1 es indiferente entre las estrategias puras cara y cruz. Ademas,puesto que la ganancia esperada del jugador 1 en (1.3.1) es independiente

    15 Los sucesos A y B son independientes si Prob{A y B} =Prob{A}Prob{B}. Asf, alescribir rq como la probabilidad de que 1 elija cara y 2 elija cara, estamos suponiendo que1 y 2 toman sus decisiones de forma independiente, como corresponde a la descripci6n quedimos de los juegos de decision simultanea. ConsUltese Aumann (1974) para la definici6n deeauilibrio correlacionado, que se utiJiza en juegos en los cuales las decisiones de los jugadorespueden estar correlacionadas, puesto que observan el resultado de un suceso aleatoric, comoellanzamiento de una moneda, antes de elegir sus respectivas estrategias.

  • 36 / JUEGOS ssrxncos CON INFORMACI6N COMPLlITA (c. 1)

    de r cuando q = 1/2, el jugador 1 es tambien indiferente entre todas lasestrategias mixtas (r,1 - r). Es decir, cuando q = 1/2 la estrategia mixta(r,1 - r) es la mejor respuesta a (q,l - q) para cualquier valor de r entrecero y uno. As!, r(1/2) es todo el intervalo [0, 1], como indica el segmentovertical de r(q) en la figura 1.3.3. En el analisis del modelo de Cournoten la secci6n 1.2.A, llamamos a R;(qj) la funci6n de mejor respuesta de laempresa i. Aquf, puesto que existe un valor de q tal que r*(q) tiene masde un valor, llamamos a r(q) la correspondencia de mejor respuesta deljugador 1.

    Para derivar de forma mas general la mejor respuesta del jugadori a la estrategia mixta del jugador j, as! como para dar un enunciadoformal de la definici6n ampliada del equilibrio de Nash, limitamos ahoranuestra atenci6n al caso de dos jugadores, que permite presentar las ideasprincipales de modo mas sencillo. Sea J el mimero de estrategias purasen 81 y K el mimero de estrategias puras en 82, Vamos a escribir 81 ={sn. ... ,SlJ } Y 82 = {S21' ... ,S2K }, y vamos a utilizar Slj y 82k para denotarlas estrategias puras arbitrarias de 81 y 82 respectivamente.

    Si el jugador 1 cree que el jugador 2 utilizara las estrategias (821, ... ,92I< )con probabilidades 0 s610 si

  • Teoria avanzada: Estrategias mixtas y exisiencia de equilibrio / 37

    K K

    I:'>2kUl(Slj,S2k) ~ LP2kUl(Slj,S2k)k=1 k=1

    para cada Slj' en Sl. Esto es, para que una estrategia mixta sea una mejorrespuesta a P2 debe asignar una probabilidad positiva a una estrategiapura concreta s6lo si esta es una mejor respuesta a P2. De forma inversa,si el jugador 1 tiene varias estrategias puras que son mejores respuestas aP2, cualquier estrategia mixta que asigna toda su probabilidad a algunaso a todas estas mejores respuestas en estrategias puras (y probabilidadcero al resto de las estrategias puras) es tambien una mejor respuesta deljugador 1 a P2.

    Para dar un enunciado formal de la definici6n ampliada del equilibriode Nash necesitamos calcular la ganancia esperada del jugador 2 ruandolos jugadores 1y 2utilizan las estrategias mixtas PI y P2. Si el jugador 2 creeque el jugador 1 utilizara las estrategias (Sll, ... ,SlJ) con probabilidades(PI I, ...,plJ), la ganancia esperada del jugadorZ por utilizar las estrategias(S21, . , . ,S2T() con probabilidades

  • 1/2 1(Cara)

    r

    38/ JUEGOS EST.A.TICOS CON lNFORMACI6N COMPLETJ\ (c. 1)

    de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador:(1.3.4) y (1.3.5) deben cumplirse.

    q

    q*(r)(Cara) 1

    (Cruz)

    (Cruz)

    Figura 1.3.4

    r

    (Cara) 1

    1/2 ,------------------------.---_.-------- .,

    I:!

    q*(r)

    (Cruz)

    (Cruz)

    1 q(Cara)

    Figura 1.3.5

    A continuaci6n, aplicamos esta definici6n al juego de las monedas yala batalla de los sexos. para ello, utilizamos la representaci6n grafica de la

  • Teoria avanzada: Estrategias mixias y existencia de equilibria / 39

    mejor respuesta del jugador ia la estrategia mixta del jugador j presentadaen la figura 1.3.3. Para complementar la figura 1.3.3 calculamos el(los)valor(es) de q, denotado(s) por q*(r), tal(es) que (q,1 - q) es una mejorrespuesta del jugador 2 a (r,l- r) del jugador 1. Los resultados se recogenen la figura 1.3.4. Si r < 1/2, la mejor respuesta de 2 es cruz, de forma queq*(r) = 0. Del rnismo modo, si r > 1/2, la mejor respuesta de 2 es cara, deforma que q*(r) = 1. Si r = 1/2, el jugador es indiferente no solo entre caray cruz sino tambien entre todas las estrategias rnixtas (q,1 - q), de formaque q*(1/2) es todo el intervalo [0, 1].

    Girando 90 grad os la figura 1.3.4 y dandole la vuelta, obtenemos lafigura 1.3.5. Esta es menos adecuada que la figura 1.3.4 como represen-tacion de la mejor respuesta del jugador 2 a la estrategia rnixta del jugador1, pero puede combinarse con la figura 1.3.3 para obtener la figura 1.3.6.

    r

    ................. ~ .

    , ; _J

    .......................... _--

    q*(r)

    (Cara) 1

    1/2

    (Cruz)1/2 1

    (Cara)

    q(Cruz)

    Figura 1.3.6

    La figura 1.3.6 es analoga a la figura 1.2.1 del analisis de Cournotde la seccion 1.2.A. Igual que la interseccion de las funciones de mejorrespuesta R2(ql) y Rl (q2) dio el equilibrio de Nash del juego de Cournot,la interseccion de las correspondencias de mejor respuesta r*(q) y q*(r)nos da el equilibrio de Nash (en estrategias rnixtas) en el juego de lasmonedas: si un jugador i elige 0/2,1/2), (1/2,1/2) es la mejor respuestadel jugador i.tal como 10 exige el equilibrio de Nash.

  • 40 / JUEGOS ESTAncos CON lNFORMACJ6N COMPLETA (C. 1)

    de las cofigura 1Y (q = 1equilibridescritos

    Conviene resaltar que el equilibrio de Nash en estrategias mixtas no sebasa en que ningun jugador lance una moneda al aire, arroje unos dados 0elija de forma aleatoria una estrategia. Mas bien, interpretamos la estrate-gia mixta del jugador j como una representaci6n de la incertidumbre deljugador i respecto a la decisi6n del jugador j sobre la estrategia (pura) queva a seguir. En beisbol, por ejemplo, ellanzador puede decidir si lanzaruna bola rapida 0una curva basandose en c6mo le salieron los lanzamien-tos durante el entrenamiento. Si el bateador conoce el razonamiento dellanzador pero no sabe que ocurri6 durante su entrenamiento, puede serque crea que existen las mismas posibilidades de que ellanzador lanceuna bola rapida 0 curva. Representarfamos entonces la conjetura del ba-teador como la estrategia mixta dellanzador (1/2,1/2), cuando en realidadellanzador elige una estrategia pura basandose en la informaci6n que nodispone el bateador.

    Enunciado de un modo mas general, la idea consiste en dotar al juga-dor j de una cierta informaci6n privada de manera que, dependiendo dec6mo el jugador j entienda dicha informaci6n, se incline por una de lasestrategias puras posibles. Sin embargo, puesto que el jugador i no dis-pone de la informaci6n privada de j, i continua con la incertidumbre deno saber cual sera la decisi6n de j, y representamos dicha incertidumbrede i como una estrategia mixta de j. Ofrecemos un enunciado mas formalde esta interpretaci6n de las estrategias mixtas en la secci6n 3.2.A.

    Consideremos la batalla de los sexos, de la secci6n 1.1.C, como unsegundo ejemplo de equilibrio de Nash con estrategias mixtas. Sea (q,1- q)la estrategia mixta en la cual Pat elige la 6pera con probabilidad q y sea(r,1 - r) la estrategia mixta en la cual Chris elige 6pera con probabilidad r.SiPatelige(q,1-q), las gananciasesperadas de Chris son q2+(1-q)0 = 2qal elegir 6pera y q . 0 + (1 - q) . 1 = 1 - q al elegir boxeo. Asi, si q > 1/3,la mejor respuesta de Chris es 6pera (es decir, r = 1); si q < 1/3la mejorrespuesta de Chris es boxeo (es decir, r = 0) y, si q = 1/3, cualquier valorde r es una mejor respuesta. De modo similar, si Chris elige (r,l - r)las ganancias esperadas de Pat son r . 1 + (1 - r) 0 = r al elegir 6pera yr0+(1-r)2 = 2(1-r) alelegirboxeo. Asl.si r > 2/3,lamejorrespuesta dePat es 6pera (es decir, q = 1); si r < 2/3la mejor respuesta de Pat es boxeo(es decir, q = 0) y, si r = 2/3 cualquier valor de q es una mejor respuesta.Como muestra la figura 1.3.7, las estrategias mixtas (q,l - q) = (1/3,2/3)de Pat y (r,l - r) = (2/3,1/3) de Chris forman, por 10 tanto, un equilibriode Nash.

    AI contrario que en la figura 1.3.6, donde s6lo existia una intersecci6n

    Encwras 0 mix1mejor res}dores y~estrategiaipondenrugraficas sesolo tiene-cualquierincluya es

    Consk1.3.8. Hayen estas c.C > z eey > w.casos rests

  • Teoria avanzada: Estrategias mixias y existencia de equilibria / 41

    de las correspondencias de mejor respuesta de los jugadores, existen en lafigura 1.3.7 tres intersecciones de r*(q) y q*(r): (q = O,r = 0), (q = I,r = 1)Y (q = 1/3,r = 2/3). Las dos primeras intersecciones representan losequilibrios de Nash en estrategias puras (boxeo, boxeo) y (6pera, 6pera)descritos en la secci6n I.I.C.

    rr"'(q)

    (Opera)11-----::-=====""f__:

    213q*(r)

    rl .i

    I1._ ..... _..... ..:(Boxeo) -+==:.:,:._------'---

    1/3 1(Opera)

    q(BoxeD)

    Figura 1.3.7

    En cualquier juego, un equilibrio de Nash (que incluya estrategias pu-ras 0 mixtas) aparece como una intersecci6n de las correspondencias demejor respuesta de los jugadores, incluso cuando hay mas de dos juga-dores y tambien cuando algunos 0 todos los jugadores tienen mas de dosestrategias puras. Por desgracia, los unicos juegos en los que las corres-pondencias de mejor respuesta de los jugadores tienen representacionesgraficas sencillas son los juegos de dos jugadores en los que cada jugadorsolo tiene dos estrategias. Discutimos ahora con un argumento grafico quecualquier juego de ese tipo tiene un equilibrio de Nash (que posiblementeincluya estrategias mixtas).

    Consideremos las ganancias del jugador 1 representadas en la figura1.3.8. Hay dos comparaciones importantes: x con z e y con w. Basandonosen estas comparaciones, podemos definir cuatro casos principales: (i):c > z e y > ui; (ii) x < z e y < ui; (iii) x > z e y < w, y (iv) x < ze y > w. Discutimos primero estos cuatro casos y luego abordamos loscasos restantes en los que x = Z 0 Y = w.

  • 42 / JUEGOS ESTATICOSCON INFORMACl6N COMPLETA (C. 1)

    Jugador 2

    Izquierda Derecha

    Alta x,- y,-Jugador 1

    Baja z,- w,-

    Figura 1.3.8

    En el caso (i) para el jugador 1 alta domina estrictamente a baja, y enel caso (ii) baja domina estrictamente a alta. Recordemos de la secci6nprevia que una estrategia es estrictamente dominada si y s6lo si no existeuna conjetura que el jugador i pudiera formarse (sobre las estrategias queelegiran los demas jugadores) tal que hiciera 6ptimo elegir Si. ASl, .si(q,l - q) es una estrategia mixta del jugador 2, donde q es la probabilidadde que 2 elija izquierda, en el caso (i) no existe un valor de q tal que bajasea 6ptima para el jugador 1, y en el caso (ii) no existe un valor de q talque alta sea optima, Si (r,l - r) denota una estrategia mixta del jugador 1en la que r es la probabilidad de que 1 elija alta, podemos representar lascorrespondencias de mejor respuesta para los casos (i) y (ii) como en lafigura 1.3.9. (En estos dos casos las correspondencias de mejor respuestason de hecho funciones de mejor respuesta, puesto que no existe un valorde q tal que el jugador 1 tenga multiples mejores respuestas.)

    r(Alta) 1 l-::..=...=...=...=...=...=...=...=...=..=...=...=..

    r(Alta) 1 1---------,

    r*(q)

    r"(q)

    (Baja) .......... __ __ _--_ ..(Baja)

    (lzquierda)1 q

    (Derecha) (Izquierda)1 q

    (Derecha)

    Caso (i) Caso (ii)

    Figura 1.3.9

  • Teoria avanzada: Estraiegias mixtas y exisiencia de equilibria / 43

    En los casos (ill) y (iv), ni alta ni baja son estrictamente dominadas.As!, alta debe ser optima para algunos valores de q y baja 6ptima para losdemas. Sea q' = (w - y)/(x - z + w - y). En el caso (iii) alta es optima paraq> q' y baja para q < q', mientras que en el caso (iv) ocurre 10 contrario.En ambos casos, cualquier valor de r es 6ptimo cuando q = qt. Estascorrespondencias de mejor respuesta se representan en la figura 1.3.10.

    r(Alta) 1 1----:-:..=...=...=...=...=...=...=...::71

    r(Alta) 1 1-::..=...=...=...=...=...=...=..c;----,

    r'(q)r*(q)

    (Baja)(Baja)q' 1 q

    (Izquierda) (Derecha)Casa (iii)

    (Izquierda)q' 1 q(Derecha)

    Caso (iv)

    Figura 1.3.10

    Puesto que q' = 1 si x = z y q' = 0 si y = w, las correspondencias demejor respuesta en los casos en que ocurra z = Z 0 Y = w tienen forma deL (es decir, dos caras adyacentes del cuadrado unitario), como ocurririaen la figura 1.3.10 si q' = 001 en los casos (iii) y (iv).

    Afiadiendo ganancias arbitrarias del jugador 2 a la figura 1.3.8 y rea-lizando calculos analogos obtenemos la mismas cuatro correspondenciasde mejor respuesta, con la salvedad de que en el eje horizontal se mider y en el vertical se mide q, como en la figura 1.3.4. Girando 90 gradosy dando la vuelta a esas cuatro figuras, como hicimos para obtener 1.3.5,obtenemos 1.3.11 y 1.3.12. (En estas figuras r' se define de forma analogaa q' en la figura 1.3.10.)

    La cuesti6n crucial es que, dada cualquiera de estas cuatro corres-pondencias de mejor respuesta del jugador I, r*(q) de las figuras 1.3.901.3.10, Ycualquiera de las cuatro del jugador 2, q*(r) de las figuras 1.3.11o 1.3.12, el par de correspondencias de mejor respuesta tiene al menosuna intersecci6n, por 10 que el juego tiene al menos un equilibrio de Nash.Comprobarlo para los dieciseis pares posibles de correspondencias de me-jor respuesta se deja como ejercicio. En lugar de ello, nosotros vamos a

  • r(Alta) 1 f-.-------,

    44 / JUEGOS FSTATICOS CON INFORMACI6N COMPLETA (c. 1)

    deseribir las earaeterfstieas eualitativas que