Teoria de Juegos

TEORIA DE JUEGOS

Que es un juego

En el lenguaje ordinario, la palabra juego hace referencia a divertimiento y tambin a actividades en que los participantes son sometidos a reglas que hay que cumplir, intentan ganar, pero pueden perder. Son muy conocidos los llamados juegos de mesa como el pker y el ajedrez, los juegos deportivos como el futbol o el tenis, o ms recientemente los juegos de computador.

En estos juegos cada jugador intenta conseguir el mejor resultado posible (Maximizar su utilidad), pero teniendo en cuenta que el resultado del juego no solo depende de sus acciones, sino tambin de las acciones de los otros jugadores. Es estas caractersticas de los juegos (tomar decisiones que ms convengan para ganar, teniendo que cumplir con las reglas del juego, y sabiendo que los dems jugadores tambin influyen en los resultados con sus decisiones) la que ms valor tiene para su estudio sistemtico

Cul es la historia de la teora de juegos

La primera discusin conocida de la teora de juegos aparece en una carta escrita porJames Waldegraveen1713. En esta carta, Waldegrave proporciona una solucinmnimadeestrategia mixtaa una versin para dos personas del juego de cartas le Her. Sin embargo no se public un anlisis terico de teora de juegos en general hasta la publicacin deRecherches sur les prncipes mathmatiques de la thorie des richesses, deAntoine Augustin Cournoten1838. En este trabajo, Cournot considera unduopolioy presenta una solucin que es una versin restringida delequilibrio de Nash.

Aunque el anlisis de Cournot es ms general que el de Waldegrave, la teora de juegos realmente no existi como campo de estudio aparte hasta queJohn von Neumannpublic una serie de artculos en1928. Estos resultados fueron ampliados ms tarde en su libro de1944,Theory of Games and Economic Behavior8, escrito junto conOskar Morgenstern. Este trabajo contiene un mtodo para encontrar soluciones ptimas para juegos de suma cero de dos personas. Durante este perodo, el trabajo sobre teora de juegos se centr, sobre todo, en teora de juegos cooperativos. Este tipo de teora de juegos analiza las estrategias ptimas para grupos de individuos, asumiendo que pueden establecer acuerdos entre s acerca de las estrategias ms apropiadas.En1950Albert W. Tuckerplante formalmente las primeras discusiones deldilema del prisionero, y se emprendi un experimento acerca de este juego en la corporacinRAND. En ese aoJohn Nashdesarroll una definicin de una estrategia ptima para juegos de mltiples jugadores donde el ptimo no se haba definido previamente, conocido comoequilibrio de Nash, bajo la supervisin del mencionado Tucker. Este equilibrio es suficientemente general, permitiendo el anlisis de juegos no cooperativos adems de los juegos cooperativos.

La teora de juegos experiment una notable actividad en la dcada de 1950, momento en el cual los conceptos base, el juego de forma extensiva, el juego ficticio, los juegos repetitivos, y elvalor de Shapleyfueron desarrollados. Adems, en ese tiempo, aparecieron las primeras aplicaciones de la teora de juegos en lafilosofay lasciencias polticas.

En1965,Reinhard Seltenintrodujo su concepto de solucin de los equilibrios perfectos del subjuego y el concepto deequilibrio perfecto de mano temblorosa, que ms adelante refinaron el concepto de equilibrio de Nash. En1967John Harsanyidesarroll los conceptos de la informacin completa y de losjuegos bayesianos. l, junto conJohn Forbes Nashy Reinhard Selten, ganaron elPremio Nobel de Economaen1994.

En ladcada de 1970la teora de juegos se aplic extensamente a labiologa, en gran parte como resultado del trabajo deJohn Maynard Smithy su concepto estrategia estable evolutiva. Adems, los conceptos delequilibrio correlacionado,equilibrio perfecto de mano temblorosa, y del conocimiento comn fueron introducidos y analizados.

Formas de representar los juegos.Los juegos estudiados por la teora de juegos estn bien definidos por objetos matemticos. Un juego consiste en un conjunto de jugadores, un conjunto de movimientos (o estrategias) disponible para esos jugadores y una especificacin de recompensas para cada combinacin de estrategias. Hay dos formas comunes de representar a los juegos.

Representacin de Juegos de dos jugadores en forma normal Se hace un listado con las estrategias posibles de cada jugador. Se colocan las estrategias en una matriz. Las filas de la matriz corresponden a las estrategias del jugador 1, las columnas a las estrategias del jugador 2. Las ganancias de las ramas terminales se colocan en las casillas correspondientes de la matriz.

Juegos en forma extensiva1. Un rbol de decision contiene toda la informacin necesaria para resolver un juego.2. Los puntos de decisin del rbol se llaman nodos3. Un nodo con un crculo alrededor y el nmero de jugador en su interior es un conjunto de informacin: muestra a qu jugador le corresponde jugar y qu es lo que el jugador sabe en ese momento.4. Las alternativas que salen de cada nodo se llaman ramas5. Los resultados correspondientes a cada nodo terminal se denominan ganancias

A que se denomina jugador, pagos, estrategia, resultados del juego.

Jugador: Son los participantes en el juego que toman decisiones con el fin de maximizar su utilidad. Son dos o ms

Pagos: Cada jugador recibe un pago al acabar el juego, que depende de cual haya sido el resultado del juego. El significado de dicho pago es la utilidad de cada jugador atribuye a dicho resultado, es decir la valoracin que para el jugador tiene las consecuencias de alcanzar un determinado resultado del juego

Estrategia: Una estrategia de un jugador es un plan completo de acciones con las que este podra proponerse participar en dicho juego. Un perfil de estrategias es un conjunto de estrategias, una por cada jugador

Resultados del juego: Son los distintos modos en que puede concluir un juego. Cada resultado lleva aparejadas unas consecuencias para cada jugador.

En que consiste la formulacin de juegos.

Para ilustrar las caractersticas bsicas de un modelo de teora de juegos, considrese el juego llamado pares y nones. ste consiste nada ms en que los dos jugadores muestran al mismo tiempo uno o dos dedos. Si el nmero de dedos coincide, el jugador que apuesta a pares (por ejemplo, el jugador 1) gana la apuesta (digamos $l) al jugador que va por nones (jugador II). Si el nmero no coincide, el jugador 1 paga $l al jugador II. Entonces, cada jugador tiene dos estrategias: mostrar uno o dos dedos. La tabla a continuacin contiene el pago en dlares que resulta para el jugador 1 en una matriz de pagos.

En general, un juego de dos personas se caracteriza por 1. Las estrategias del jugador I. 2. Las estrategias del jugador II. 3. La matriz de pagos. Antes de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su oponente y la matriz de pagos. Una jugada real en el juego consiste en que los dos jugadores elijan al mismo tiempo una estrategia sin saber cul es la eleccin de su oponente.

Solucin de juegos sencillos.Dos polticos, contendientes entre s, se postularon para el Senado de Estados Unidos. En este momento ellos estn haciendo sus planes de campaa para los dos ltimos das anteriores a las elecciones; se espera que dichos das sean cruciales por ser tan prximos al final. Por esto, ambos quieren emplearlos para hacer campaa en dos ciudades importantes: Bigtown y Megalopolis. Para evitar prdidas de tiempo, estn planeando viajar en la noche y pasar un da completo en cada ciudad o dos das en slo una de las ciudades. Como deben hacer los arreglos necesarios por adelantado, ninguno de los dos sabr lo que su oponente tiene planeado hasta despus de concretar sus propios planes. Cada poltico tiene un jefe de campaa en cada ciudad para asesorarlo en cuanto al impacto que tendrn (en trminos de votos ganados o perdidos) las distintas combinaciones posibles de los das dedicados a cada ciudad por ellos o por sus oponentes. Ellos quieren emplear esta informacin para escoger su mejor estrategia para estos dos das. FORMULACIN. Para formular este problema como un juego de dos personas y suma cero, se deben identificar los dos jugadores (obviamente los dos polticos), las estrategias de cada jugador y la matriz de pagos. Segn la forma en que se estableci el problema, cada jugador tiene tres estrategias: Estrategia 1 = pasar un da en cada ciudad. Estrategia 2 = pasar ambos das en Bigtown. Estrategia 3 = pasar ambos das en Megalopolis. Por el contrario, las estrategias seran ms complicadas en una situacin diferente en la que cada poltico pudiera saber en dnde pasar su oponente el primer da antes de concluir sus propios planes para el segundo da. En ese caso, una estrategia normal sera: pasar el primer da en Bigtown; si el oponente tambin pasa el da en Bigtown, entonces quedarse el segundo da ah; sin embargo, si el oponente pasa el primer da en Megalopolis, entonces pasar el segundo da en dicho lugar. Habra ocho estrategias de este tipo, una para cada combinacin de las dos posibilidades para el primer da, las dos para el primer da del oponente y las dos alternativas para el segundo da.

Juegos con estrategias mixtas.Cualquier estrategia donde intervenga un componente de azar es una estrategia mixta, Un equilibrio en el cual al menos un jugador sigue una estrategia mixta es un equlibrio en estrategias mixtas. Un jugador usa una estrategia mixta cuando no quiere ser completamente previsible.

Una estrategia mixta es una distribucin de probabilidad de estrategias puras: existe la probabilidad de emplear al menos dos estrategias puras. El nivel adecuado de imprevisibilidad no debera dejarse librado al azar: un jugador que usa una estrategia mixta fija las probabilidades que gobiernan el mecanismo aleatorio de decisin de modo de maximizar su utilidad esperada.

Juegos estticos con informacin completa.En juegos estticos deinformacin completayperfecta, una forma normal de representacin de un juego es una especificacin de los espacios de estrategia de los jugadores y las funciones de recompensa. Un espacio de estrategia de un jugador es el conjunto de estrategias disponibles para ese jugador, mientras que una estrategia es un plan completo de accin para cada situacin del juego, sin tener en cuenta si esa situacin se da realmente en el juego. Una funcin de recompensa de un jugador es una correspondencia entre el producto cruzado de los espacios de estrategia de los jugadores y el conjunto de recompensas del jugador (normalmente, el conjunto de los nmeros reales, donde el nmero representa una utilidad ordinal o cardinal - a menudo cardinal) de un jugador, por ejemplo la funcin de recompensa de un jugador toma como entrada un perfil de estrategia (es decir, la especificacin de las estrategias de cada jugador) y da lugar a una representacin de la recompensa a su salida.

Juegos dinmicos con informacin completa. Son juegos en los que los jugadores posteriores tienen algn conocimiento de las acciones previas. Este conocimiento no necesariamente tiene que ser perfecto; slo debe consistir en algo de informacin. Por ejemplo, un jugador1 puede conocer que un jugador2 no realiz una accin determinada, pero no saber cul de las otras acciones disponibles eligi.La diferencia entre juegos simultneos y secuenciales se recoge en las representaciones discutidas previamente. La forma normal se usa para representar juegos simultneos, y la extensiva para representar juegos secuenciales. Juegos estticos con informacin incompleta. Los Juegos estticos con informacin incompleta.se caracterizan por tener Racionalidad, Conocimiento mutuo de la racionalidad. Yo soy racional y s que los otros jugadores son racionales y tambin s que ellos saben que yo s que ellos son racionales y que yo s que ellos saben que yo s que ellos son racionales, Eleccin simultnea, Informacin incompleta de pagos de los jugadores. Juegos repetidos En lateora de juegos, unjuego repetido(superjuego o juego iterado) es unjuego en forma extensivaque consiste en un cierto nmero de repeticiones de un juego base (llamado un juego de etapa). El juego suele ser de 2 jugadores. Capta la idea de que un jugador tendr que tener en cuenta el impacto de su accin actual sobre las acciones futuras de otros jugadores, lo que a veces se llama su reputacin. La presencia de diferentes equilibrios se debe a la amenaza de represalias es real, ya que se va a jugar el juego de nuevo con la misma persona. Se puede demostrar que todas las estrategias que tiene una rentabilidad superior a la rentabilidad minmax pueden ser unequilibrio de Nash, que es un conjunto muy amplio de estrategias.

Juegos cooperativos Enteora de juegos, unjuego cooperativoes unjuegoen el cual dos o ms jugadores no compiten, sino que se esfuerzan por conseguir el mismo objetivo y por lo tanto ganan o pierden en conjunto. En otras palabras, es un juego donde grupos de jugadores (coaliciones) pueden tomar comportamientos cooperativos, pues el juego es una competicin entrecoalicionesde jugadores y no entre jugadores individuales. Un ejemplo de juego cooperativo es unjuego de coordinacin, donde los jugadores escogen las estrategias por un proceso detoma de decisiones consensuada.

Dilema de los prisioneros

Un resultado es eficiente si no existe ningn otro resultado que proporcione a todos los jugadores una ganancia mayor.

Todo juego en el que cada jugador tiene una estrategia dominante tiene una nica solucin que consiste en jugar esa estrategia dominante. Cuando la solucin resultante es ineficiente, se est frente a un problema tipo Dilema de los Prisioneros: Los jugadores estn presos de sus propias estrategias, a no ser que algo cambie en las reglas del juego.

La caza del siervoEnteora de juegos, lacaza del ciervoes un juego que describe un conflicto entre seguridad y cooperacin social. Otros nombres para este juego o sus variantes son "juego de la seguridad", "juego de coordinacin" y "dilema de la credibilidad".Jean-Jacques Rousseaudescribi una situacin en la que dos individuos van a cazar. Cada uno elige cazar unciervoo unaliebre. Cada jugador debe elegir una accin sin conocer la del otro. Si un individuo caza un ciervo, debe cooperar con su compaero para tener xito. Un jugador individual puede cazar una liebre por s mismo, pero una liebre vale menos que un ciervo. Esta situacin se considera una analoga importante con la cooperacin social.Un ejemplo de lamatriz de recompensaspara la caza del ciervo sera:Un ejemplo de lamatriz de recompensaspara la caza del ciervo sera:CiervoLiebre

Ciervo4, 40, 3

Liebre3, 03, 3

Una caza del ciervo

Juegos de votacin (poltica)

Toda votacin simple puede interpretase como un juego esttico cuyos jugadores son los votantes, cuyas acciones o estrategias se identifican con las posibles papeletas de voto que cualquier votante pueda depositar cuyos resultados cuyos resultados hacen referencia a las alternativas o candidatos que puedan resultar elegidos y cuyos pagos estn determinados por la preferencias de votantes hacia los posibles resultados. Pensemos, por ejemplo en un comit de tres personas C1, C2 y C3, encargados de selelcionar para un puesto a una persona, de entre tres candidatos A, B y C, midante votacin. Para espeficar compeltamente las reglas del juego, supongamos Que se vota esciribeindo una papeleta con un solo nombre y no se puede votar en blanco Que gana el candidato que obtanga la mayora de votos y que encaso de empate decida en el voto del candidato C1

Asi pues los posibles resultados son A, B Y C.

Supongamos tambin que las preferencia de los votantes son:

Votante C1: A> B > C (donde > significa )Votante C2: B > C > AVotante C3: C > A > B

Lo que traduciremos a las siguientes funciones de ganancias

En este caso la forma estratgica del juego presenta tres trimatrices, una por cada jugada posible del tercer jugador. Se ha indicado entre parntesis, junto a cada vector de pagos, el resultado del juego correspondiente (Candidato Vencedor)

El juego del CiempisEl Juego del Ciempis es un experimento que se fundamenta en una competicin entre dos contrincantes, estudiada por laTeora de juegosintroducida en 1981 por primera vez por Robert Rosental y que sirve para ejemplificar juegos de informacin perfecta que no pueden ser representados por unaMatriz de pagospero s enForma extensiva. As como la excepcin entre la representacin del resultado terico y del resultado emprico.El nfasis lo da la capacidad de cooperacin y nuestra capacidad para representar las necesidades personales sobre las del contrincante.Las reglas del Juego Dos jugadores Dos montones de monedas, primer montn tiene 2 monedas, el segundo montn tiene 0 Por turno cada jugador debe elegir entre:1.- Quedarse con el monto ms grande y dar el ms pequeo al contrario.2.- Pasar ambos montones al contrario. Cada vez que un jugador elige la opcin 2, los montones crecen 1 moneda Si el juego llega a los 100 turnos y ninguno de los jugadores elige la opcin 1, el juego termina y nadie gana nada.

Eljuego del Ultimtumes un juego experimental deeconomaen el cual dos jugadores interactan de manera annima y una sola vez, por lo que la reciprocidad no es un problema. A un jugador (A) se le propone que reparta una determinada cantidad de dinero (generalmente 100$) con otro jugador (B), segn le convenga, haciendo una nica y definitiva propuesta. El jugador (B), por su parte, podr aceptar o no dicha propuesta. En caso de no aceptar, ningn jugador ganara nada. Por el contrario, si acepta se procede al reparto segn la propuesta realizada, por el jugador (A).Es de esperar que el jugador (B) siempre acepte la propuesta que se le realice, ya que, de todos modos, sta siempre mejorara su situacin desde el principio, puesto que parte sin ninguna cantidad. Pues bien, este experimento se ha realizado en numeroso pases a lo largo de muchos aos, y la complejidad de la experiencia determina que ante una situacin de abuso de poder y/o un trato de humillante, se prefiere castigar al contrincante y hacer que ambos lo pierdan todo, antes que aceptar la propuesta. Aunque en todas las pruebas que se han hecho se demuestra que el que propone el ultimtum nunca pretende abusar del que lo recibe, realizando una oferta altruista donde ambos ganen lo mismo (50% - 50%) e incluso, en determinadas ocasiones, ofrecen una cantidad superior.El juego del ultimtum se usa como evidencia contra las teoras delhomo economicuspues muestra que las elecciones sobre criterios de justicia priman sobre las de beneficio.

Guerra de desgastesEnteora de juegos, laguerra de desgastees un modelo de agresin en la que dos concursantes compiten por un recurso de valorVal seguir jugando, mientras que constantemente acumulan costos en el tiempotque dura el concurso. El modelo fue formulado originalmente porJohn Maynard Smith,1una mezcla de unaestrategia evolutivamente estable(ESS) se determin por Bishop y Cannings.2Estratgicamente, el juego es una subasta, en la que el premio es para el jugador con la mayor oferta, y cada jugador paga la oferta del perdedor.Los juegos de la guerra de desgaste no pueden ser debidamente resueltos usando la matriz de pagos. Los recursos disponibles de los jugadores son el nico lmite para el valor mximo de las ofertas; las pujas pueden ser cualquier nmero, si los recursos disponibles son ignorados, significa que para cualquier valor de , hay un valor que es mayor. El intento de poner todas las ofertas posibles en la matriz, sin embargo, se traducir en una matriz de . Se puede, sin embargo, utilizar una pseudo-matriz de la guerra de desgaste para entender el funcionamiento bsico del juego, y analizar algunos de los problemas que representa el juego de esta manera.El juego funciona de la siguiente manera para un dos individuos: Cada jugador hace una oferta, el que puja ms alto gana un recurso de valorV. Cada jugador paga la oferta ms baja. Si el jugador que puja el menor valor ofertab, entonces ese jugador pierde b y el otro jugador se beneficiarn de una cantidad de P V / 2, ambos pierden b - V / 2. Luce y Raiffa se refiri a esta ltima situacin como una "situacin ruinosa", el punto en el que ambos jugadores sufren, y no hay un ganador.La conclusin que se puede sacar de esta pseudo-matriz es que no hay ningn valor a una oferta que sea beneficioso en todos los casos, as que no hay unaestrategia dominante. Sin embargo, este hecho y el argumento anterior no excluye la existencia de unequilibrio de Nash. Cualquier par de estrategias con las siguientes caractersticas es un equilibrio de Nash: Una de las ofertas del jugador cero Las ofertas de otros jugadores igualan cualquier valor igual aVo superior, o mezclas entre cualquier valor V o superior.Con estas estrategias, un jugador gana y paga cero, y el otro jugador pierde y paga cero. Es fcil comprobar que ninguno de los jugadores puede ganar por estrictamente por desviarse.

Juegos asimtricosLos juegos asimtricos ms estudiados son los juegos donde no hay conjuntos de estrategias idnticas para ambos jugadores. Por ejemplo, eljuego del ultimtumy eljuego del dictadortienen diferentes estrategias para cada jugador; no obstante, puede haber juegos asimtricos con estrategias idnticas para cada jugador. Por ejemplo, el juego mostrado a la derecha es asimtrico a pesar de tener conjuntos de estrategias idnticos para ambos jugadores.

Teoria de Juegos

Documents

Transcript of Teoria de Juegos