Simulación de estrategias egoístas, altruistas y cooperativas. Vicent
Castellar Introducción: La Teoría de Juegos.[1] El origen de la Teoría de Juegos aplicada a los conflictos sociales y en particular a la economía se remonta a la obra de J. von Neumann y O. Morgenstern: Theory of Games and Economic Behavior [2]. En él, los autores manifiestan su interés en contribuir a la comprensión del carácter y funcionamiento de las instituciones sociales. En sus palabras:
Este interés en las instituciones puede inferirse de la misma historia de los autores. Si bien von Neumann era graduado en Ingeniería Química en Zurich y con un doctorado en Matemáticas obtenido en Budapest, Morgenstern se doctoró en la Universidad de Viena, en la cual fue nombrado profesor en 1935 y de la cual fue expulsado tras la invasión nazi a Austria. En ese momento Morgenstern se encontraba en los Estados Unidos y fue nombrado profesor en Princeton, donde conociera a su colega. Morgenstern participó en Viena del seminario de Ludwig von Mises y no es de extrañar que sufriera la influencia de la escuela austríacay su interés en el funcionamiento y origen de las instituciones. La Teoría de Juegos intenta estudiar las acciones humanas en sociedad, esto es, cuando existe interdependencia y tanto las acciones que se realicen como los resultados que se obtengan dependen de las acciones de otros[3]. Por esa razón se la asocia normalmente con la estrategia, tratando de determinar cuáles son las acciones que jugadores capaces de encontrar la mejor estrategias seguirían para asegurarse los mejores resultados posibles. Existen numerosos tipos diferentes de juegos. Inicialmente la literatura sobre el tema analizó juegos de puro conflicto (o suma cero). A continuación se estudiaron otros llamados juegos cooperativos donde los participantes eligen e implementan sus acciones en conjunto. Posteriormente el análisis se centró en juegos no cooperativos donde los actores toman las decisiones en forma separada pero su relación con las decisiones de otros incorporan elementos de cooperación y de rivalidad. Por último, se presta mucha atención ahora a los juegos evolutivos o iterados donde se asume que un juego determinado se juega repetidas veces en la que aporta nueva información en cada repetición. Los elementos de la Teoría de los juegos Elementos presentes en todo juego son: jugadores, acciones, información, estrategias, recompensas, resultados y equilibrio:
El dilema del prisionero Desarrollado por M. Flood y M. Dresher de la Rand Corporation, formalizado por A. Tucker, un matemático de Princeton y tratado de forma especial por autores como J. von Newmann y R. Axelrod [4] más recientemente y plantea la situación de dos sospechosos de un delito que han sido detenidos, se los mantiene en celdas separadas sin comunicación entre sí, y son interrogados por separado. A cada uno de ellos se le presentan dos opciones: confesar el delito o no. El interrogador le ofrece a cada uno de ellos la libertad si confiesa y en tal caso cinco años de cárcel para su socio. Si ambos confiesan les cae una pena de tres años y si ambos se niegan a hacerlo, es decir, cooperan, entonces sólo podrán ser castigados por una infracción menor y recibirán una pena de un año. Desarrollado en la forma matricial en la que se presentan muchos juegos, la situación es la siguiente:
Puede parecer artificial esta situación, sin embargo la prensa reciente cuenta con noticias que la recuerda; sirva como ejemplo la siguiente transcripción de un periódico EL PAÍS, viernes 14 de abril de 2000 Arrestados otros cuatro jóvenes por el crimen de la Villa Olímpica barcelonesa
Cada jugador tiene aquí una estrategia dominante, entendiendo por ésta a la mejor respuesta que pueda elegir ante cualquier de las dos alternativas que se le presentan al otro jugador. Veamos el caso del jugador A, cuyas recompensas se expresan en los números de la izquierda de cada casillero. A, por supuesto, no sabe qué alternativa va a elegir B. Siendo que suponemos que A prefiere un menor tiempo de castigo a uno mayor vemos que en la alternativa de que B coopere con él, esto quiere decir que no lo delate, su mejor alternativa es traicionar, es decir, delatar a B y salir libre. Y en la alternativa que B traicione (o delate), también su mejor opción es traicionar pues la recompensa que recibe es una pena menor (3 en lugar de 5 años). Es decir, a A le conviene en todo caso traicionar, delatar a B. Veamos ahora lo que sucede con B, cuyas recompensas son los números de la derecha. En el caso que A decida cooperar le conviene traicionar ya que sale libre en vez de ir a prisión por un año. Lo mismo si A decide traicionar. Como vemos la estrategia de traicionar es una estrategia dominante, es la mejor respuesta a cualquiera de las alternativas que elija el otro jugador. En otros términos, A se preguntará qué es lo que B hará ya que su propia recompensa depende de lo que B decida hacer. No solamente se siente tentado a delatarlo porque de esa forma sale libre sino que eso se ve reforzado por el temor a que B lo haga y A termine recibiendo la mayor pena solo. Ante tal posibilidad, terminar delatando, lo mismo que B. El resultado es una solución de equilibrio. El dilema del prisionero no solamente es un claro ejemplo de estrategia dominante sino que plantea otro problema fundamental. Véase que ambos jugadores hubieran estado en una posición mejor para ambos si hubieran cooperado: hubieran recibido una pena de un año de prisión pero terminan los dos con tres años. ¿Es posible la cooperación? Juegos del tipo dilema del prisionero presentan una situación lúgubre. Dos individuos que persiguen sus intereses personales, se ven guiados a un resultado adverso para ambos salvo que existan normas que impidan la traición. En palabras de G. Brennan y J.. M. Buchanan [5].
Y con relación al dilema del prisionero en particular, los autores señalan:
Además, una norma debe estar acompañada por la capacidad de imponer su cumplimiento. Veamos esto con relación al dilema del prisionero: si relajáramos un poco los supuestos del ejemplo y diéramos a ambos jugadores la posibilidad de conversar entre sí antes de decidir su jugada, podrían ellos llegar voluntariamente a un acuerdo para seguir una determinada norma como podría se la mutua coperación. Pero como un acuerdo se puede romper deberemos considerar alguna forma de verificar la acciones. El dilema del prisionero ha dado mucho que hablar en el ámbito de las ciencias sociales y parece una buena descripción de ciertas situaciones en las que están en juego las posibilidades de cooperar o no. No obstante, su principal debilidad es que se trata de un juego de una sola vez y, siendo que en la vida nos encontramos con juegos repetidos el caso planteado termina sirviendo para describir situaciones terminales o aquellas en las que la posibilidad de nuevas rondas de juego son nulas. Ahora bien, ¿qué tipo de estrategias garantizan la emergencia de la cooperación entre individuos que persiguen su propio interés? Robert Axelrod, profesor de ciencias políticas de la Universidad de Michigan, organizó un torneo entre distintos expertos en teoría de los juegos y sistemas solicitando que diseñaran lo que ellos estimaban era la mejor estrategia para aplicar en un juego repetido del dilema del prisionero. El resultado general obtenido por Axelrod es que las estrategias que priorizaron la cooperación en lugar de tratar de aprovecharse del otro jugador obtuvieron mejores resultados, demostrando que aun cuando dos jugadores tienen en cuenta solamente sus intereses, les conviene cooperar entre sí. La cooperación, entonces, surge espontáneamente. ¿Cómo puede ser eso posible? Esa es la pregunta que quiso contestar y con la cual inicia su libro:
Los resultados del torneo van aun más allá. Comenta R. Dawkins en El Gen Egoísta:
El Dilema del Prisionero y la vida cotidiana: La reputación La preocupación por obtener una cierta calidad y reputación explicada como resultado de interacciones repetidas no es nueva. En la obra de A. Smith Lectures in Jurisprudence [6] encontramos
Aunque un siglo y medio antes que se desarrollara la Teoría de Juegos, ¿no planteaba A. Smith el resultado de un juego repetido del dilema del prisionero? Estrictamente no, pero sólo existe una diferencia que juega a favor de la cooperación, y es ésta: en un juego de ese tipo los jugadores son impuestos, pero en los intercambios de la vida real los jugadores se eligen. Aquel que no tenga una reputación de cumplir sus compromisos no lograría realizar intercambios. Tullock [7] lo describe de la siguiente forma y que recibe el nombre de Dilema del Prisionero con posibilidad de aceptación y rechazo:
Para ambos jugadores, si la perspectiva es que el otro va a traicionar la mejor opción es no jugar. En el caso original del Dilema del Prisionero los dos se encontraban en una situación en la que estaban obligados a jugar. Ahora no es así y esa libertad de elección es la que elimina el problema. Estrechamente relacionado con la reputación se encuentra la decisión sobre la calidad del producto o servicio a ofrecer. En términos simples nos encontraríamos en una situación como la siguiente:
Este caso es también llamado Dilema del Prisionero Unilateral donde el consumidor prefiere el resultado (Alta calidad compra) a cualquier otro. Aquí el resultado (Baja calidad no compra) no es un equilibrio de estrategia dominante como en el dilema del prisionero original ya que el consumidor no tiene una estrategia dominante: elegiría comprar si el vendedor elige "alta calidad" pero no comprar en caso contrario. En la medida que el vendedor espera conservar un cliente buscará la solución planteada. No es de extrañar, por ejemplo, que la política de McDonalds sea de administrar por sí y no entregar franquicias en aquellos lugares donde la mayoría de los clientes se encuentra de paso. El franquiciado podría interpretar esto como un caso de dilema del prisionero donde conviene traicionar a clientes de una sola oportunidad y descuidar la calidad en el afán de reducir costos. Para que ello no suceda, la empresa administra estos locales y, en cambio, otorga franquicias en aquellos donde el juego con los clientes tiene mayores posibilidades de ser repetido. Vida Artificial. Según lo detallado en las monografías compiladas por Levy [8] y Sigmund [9], las raíces de la Vida Artificial se remontan hasta el trabajo de J. von Neumann en durante la década de los años 40 entorno a autómatas autoreplicantes. La Vida Artificial se establece como un campo nuevo del conocimiento a partir de la primera conferencia del Vida Artificial, dirigida en 1987 por C. Langton en el Laboratorio del Nacional de Los Alamos [10]. La Vida Artificial consiste en el estudio y la simulación pormenorizados de los fenómenos básicos asociados comúnmente a los organismos vivos, tales como la producción de réplicas (reproducción), evolución, adaptación, organización (desde tejidos hasta colonias y ecosistemas...), las relaciones entre individuos o especies (parasitismo, competición, cooperación, y formación de una red social). Complementa las ciencias biológicas (Biología, Etología, Ecología,...) y sociales (Etnología, Antropología, Sociología,...) tradicionales que realizan un análisis del trabajo de campo o en el laboratorio organismos vivos procurando simular o sintetizar comportamiento realistas mediante programas de ordenador. Una meta de la Vida Artificial consiste en alcanzar a comprender los esquemas (con sus substratos matemáticos y formales) que sostienen los procesos reales y potenciales de la vida. Una segunda meta es utilizar la naturaleza y en particular las corrientes neodarwinianas de la Teoría de la Evolución [11] como inspiración para el desarrollo de los algoritmos para obtener una buena solución (la solución óptima u otra suficientemente cercana) a problemas difíciles cuya optimización analítica no es viable por estar caracterizada por dominios cuya dimensión es muy elevada, relaciones no lineales o ni siquiera diferenciales o incluso continuas, multiplicidad de óptimos locales... Los sistemas estudiados por los investigadores de la Vida Artificial son sistemas adaptativos complejos que comparten las características siguientes:
Por lo tanto, una característica habitual consiste en que el sistema queda mejor descrito si atendemos a las interacciones entre las unidades que si expresamos la complejidad inherente a cada una. Por otra parte, las redes locales de la interacción que conectan unidades individuales se recombinan y revisan continuamente. En particular, las situaciones que se pueden explotar por adaptaciones determinadas se generan y desaparecen continuamente. La estrategias que soportan este proceso se denominan estrategias evolutivamente estables. El algoritmo genético fundamenta consiste en desarrollar a partir de una población de agentes una nueva generación agentes de una población existente según las cuatro fases siguientes:
El Dilema del Prisionero como modelo de interacción en la economía. Un campo en el que la Teoría de Juegos, el Dilema del Prisionero y la Vida Artificial son elementos prometedores es la Economía Evolutiva, propuesta por autores como W. Arthur [12], R. con sus trabajos sobre los orígenes del comportamiento fiable, por D. Hirshleifer y E. Rasmusen [13] con su trabajo sobre modelos evolutivos en la economía, el trabajo de U. Witt sobre la selección natural económica... Estos estudios han sido recopilados por U. Witt [14] y R. Nelson [15]. El problema central para los investigadores es entender el aspecto, al parecer espontáneo, de la regularidad en procesos económicos como las crisis cíclicas de la economía internacional y que los economistas asocian clásicamente a la mano invisible de A. Smith. El desafío es explicar cómo estas regularidades globales emergen de las interacciones locales de los agentes autónomos canalizados a través de las instituciones económicas reales o potenciales más bien que a través de mecanismos de coordinación ficticios tales como un solo consumidor representativo o condiciones impuestas del equilibrio. Conforme a este desafío, la racionalidad se ve generalmente como hipótesis no necesariamente asumible, o por lo menos como asunción metodológica discutible, más que como un axioma del comportamiento individual. Después del citado trabajo de Axelrod y otros posteriores [16,17], el Dilema del Prisionero Iterado ha sido utilizado extensivamente por las ciencias sociales, la economía y otros investigadores como los psicólogos para explorar la aparición potencial del comportamiento mutuamente cooperativo entre agentes no-altruistas. En la actualidad, sin embargo, las interacciones socioeconómicas están caracterizadas frecuentemente por la aceptación y la denegación de socios según nuestras preferencias. La pregunta entonces se presenta si la aparición y la viabilidad duradera del comportamiento cooperativo en el juego de Dilema del Prisionero iterado serían realzadas si se permitió a los jugadores más realista elegir y rechazar a sus socios potenciales del juego. Esta pregunta la toma Stanley [18]. El juego tradicional de Dilema del Prisionero iterado se extiende a un juego de Dilema del Prisionero iterado con rechazo en el cual los jugadores elijan y rechacen a socios según las rentabilidades previstas continuamente actualizadas. Esta modificación altera de forma sustancial las acciones recíprocas que los jugadores del Dilema del Prisionero iterado mantienen de forma característica para aumentar sus beneficios. Ahora los agentes pueden encontrar nuevos socios que proporcionen un rendimiento mayor, el rechazo da a los jugadores una manera de protegerse contra defraudaciones sin tener que defraudar a su vez, y el ostracismo aumenta entre aquellos que no han sido amables en el sentido de Axelrod. Ahora la clemencia en el sentido de Axelrod pierde importancia mientras que la gana la amabilidad; sin embargo, cuando el número de agentes amables es pequeño, la necesidad de encontrar socios (o mercado) con quien mantener relaciones comerciales que aumente el número de agentes que aprovechan esta situación coyuntural y se comportan como los parásitos de un ecosistema natural. Conclusiones: La Vida Artificial, el Dilema del Prisionero y la Sociedad Real. Más realista es la creación del profesor Tesfatsion Trade Network Game, en la que generaciones sucesivas de los comerciantes virtuales representados por autómatas celulares en un mercado virtual eligen y rechazan a socios comerciales según las distintas rentabilidades previstas que varían continuamente, se embarcan en relaciones comerciales y desarrollan sus estrategias comerciales en un cierto plazo asumiendo el riesgo de ser rechazados pero también se reservan el derecho a rechazara su socio cuando estiman que es más conveniente asociarse con otro. Ahora buscar el óptimo consiste en estimar cuánto tiempo se debe ser fiel al agente con el que nos emparejamos, es decir, si debemos resistirnos a la tentación de rescindir una relación comercial para sustituirla por otra más prometedora pero de la que disponemos de menos información. Se ha programado en C la propuesta para el Trade Network Game que ha sido desarrollada por McFadzean y Tesfatsion [19,20]. Dentro de un marco general para las simulaciones evolutivas propio de la Vida Artificial: el programa SimBioSys, desarrollado por McFadzean [21] y como consecuencia, el Trade Network Game facilita el estudio de comercio en dos puntos:
Referencias
|