Nectunt Bitacora

Dilemas sociales y comportamiento humano

Estirar_de_la_soga

Racionalidad y cooperación (I).

Deja un comentario

En mi primera entrada en este blog, voy a tratar un tema de importancia crucial en casi cualquier estudio sobre el comportamiento humano: la racionalidad. La palabra racional pertenece al lenguaje cotidiano, y su significado depende estrechamente del contexto en el que es usada. Incluso en un ámbito técnico, la racionalidad puede adoptar diferentes formas. Por ejemplo, el sociólogo alemán Max Weber distinguía cuatro tipos de racionalidad; como cualquier otra teoría sociológica, esta interpretación tiene sus detractores, entre ellos los pragmáticos. En esta entrada voy a discutir qué podría llamarse racional en una serie de situaciones modeladas por la teoría de juegos, y que no siempre coincide con la definición clásica de racionalidad como maximización de utilidad.

(English version here)

Para evitar perdernos en el maremágnum de las diferentes interpertaciones de la racionalidad, vamos a centrarnos en el tema principal de este blog: la cooperación humana y la Teoría de Juegos. La Teoría de Juegos es un área de la Matemática Aplicada que emplea modelos para estudiar interacciones mediante estructuras formalizadas de incentivos. Habitualmente, una decisión racional se relaciona con los posibles beneficios que reportaría. Con el fin de analizar los incentivos y preferencias de los individuos en el proceso de toma de decisiones, vamos a introducir unos conceptos sobre acciones, recompensas y preferencias. Una relación de preferencia es completa si, para cada par de acciones, un jugador prefiere una acción respecto a la otra o es indiferente entre las dos. Si el juego está bien definido, todas las acciones pueden ser ordenadas según una relación de orden parcial respecto a las preferencias. La regla de transitividad establece que, dadas tres acciones, si la primera acción es preferida sobre la segunda, y la segunda acción es preferida sobre la tercera, entonces la primera acción es preferida sobre la tercera. Parece razonable asumir que los jugadores racionales seguirán esta regla.

No obstante, a pesar de que la teoría de juegos pertenece a las matemáticas (es decir, a las ciencias exactas), algunos aspectos son susceptibles de diferentes interpretaciones. ¿Qué debemos esperar de un jugador racional? En este sentido, existen diferentes acepciones: En economía, el concepto de homo economicus se refiere a las personas que actúan para obtener su máximo beneficio posible dada la información disponible. Aplicado a la Teoría de Juegos, el homo economicus elige sus acciones para maximizar su esperanza de pago. De acuerdo con esto, a los jugadores racionales se les asume racionalidad perfecta, es decir, siempre eligen la estrategia que maximiza su rentabilidad, siendo capaces de procesos deductivos arbitrariamente complejos para lograr ese fin. Esto se opone al concepto de Homo reciprocans, que hace referencia a aquellas personas cuya motivación principal es mejorar el bien común.

En el marco de la teoría de juegos, el dilema del prisionero se ha convertido en un estándar para el estudio del comportamiento cooperativo. Es un juego de dos jugadores y dos acciones, donde cada jugador elige una de las dos acciones disponibles: cooperar o no hacerlo. Las recompensas están ordenadas de tal manera que, independientemente de la acción del adversario, la recompensa propia es siempre mayor cuando se elige no cooperar. Sin embargo, la suma de las recompensas de ambos jugadores es mayor cuando ambos deciden cooperar (de ahí el dilema), mientras que la recompensa más baja posible se recibe cuando ninguno de los jugadores coopera. En consecuencia, ya que la acción de no cooperar es la mejor respuesta estricta frente a sí misma y frente a la cooperación, un jugador racional (en el sentido descrito anteriormente) siempre elegirá no cooperar. Por otra parte, teniendo en cuenta que las interacciones humanas (y biológicas en general) pueden ocurrir de manera repetida, el fenómeno de la cooperación se estudia a menudo a través de la teoría de juegos evolutiva. En el dilema del prisionero iterado, ambos jugadores juegan repetidamente sabiendo las acciones anteriores de su oponente, y pueden cambiar su estrategia en consecuencia. Esta versión del juego amplía las posibles recompensas en función de la estrategia propia y de la del adversario. De hecho, una acción puntual puede determinar las futuras acciones de nuestro oponente y, por lo tanto, nuestros futuros beneficios.

hola
Figura 1. Representación esquemática del dilema del prisionero (izquierda) y de la caza del ciervo (derecha). CXJJensen & Riestenberg.

 

Si queremos profundizar, este problema se puede abordar desde diferentes enfoques. El concepto de superracionalidad está basado en la idea de que dos jugadores superracionales, jugando un juego simétrico, usarán la misma estrategia. Aunque esta idea es muy antigua (ya fue introducida por Kant), en su forma actual se la debemos a Douglas Hofstadter (cuyo libro “Gödel, Escher, Bach: Un eterno y gracil bucle” muchos de nosotros hemos disfrutado). Dos agentes superracionales jugando un dilema del prisionero iterado no elegirán la acción egoísta (al menos, no lo harán repetidamente).

Este concepto de superracionalidad difiere del (mucho más aceptado) concepto de racionalidad, basado en la idea del equilibrio Nash, que a su vez se basa en la maximización de las recompensas propias sin considerar ligaduras entre las estrategias de los jugadores, pese a que en un juego simétrico la estrategia de equilibrio puede ser la misma para todos los jugadores. En el dilema del prisionero, el único equilibrio Nash estricto consiste en que ninguno de los dos jugadores coopera, esto es, partiendo de la combinación de acciones en que ninguno coopera, ningún jugador puede aumentar su beneficio individual cambiando unilateralmente de estrategia.

Por otro lado, la definición expuesta de jugador racional incluía la capacidad de desarrollar “procesos deductivos arbitrariamente complejos para lograr ese fin”, pero, ¿cómo de complejos pueden ser sus razonamientos? No hay otros límites que los impuestos por el juego (como, por ejemplo, el tiempo disponible). En 2012, William H. Press y Freeman Dyson introdujeron las estrategias de determinante cero, un nuevo tipo de estrategias para el dilema del prisionero iterado. Algunas de estas estrategias permiten a un jugador fijar el máximo beneficio que su oponente puede obtener, extorsionándole y fijando para él un pago inferior al propio. Si el jugador extorsionado eligiese no cooperar, obtendría un beneficio inferior que si eligiese una estrategia mixta (esto es, cooperar con una probabilidad dada). El jugador extorsionado puede elegir no cooperar, pero a cambio de salir perjudicado obteniendo un beneficio inferior. Forzar al oponente a cooperar para incrementar sus beneficios, como método para aumentar el beneficio propio puede ser considerado un comportamiento racional, en función de la acepción de jugador racional.

La definición de jugador racional se complica cuando tenemos en cuenta otros factores relacionados con la vida real. Consideremos una situación en la que dos agentes intercambiables pueden elegir entre las dos acciones anteriores: cooperar o no hacerlo. Ahora, a diferencia del dilema del prisionero, un determinado agente no obtendrá su mayor beneficio eligiendo una acción fija independientemente de la acción de su adversario, sino que su acción óptima depende de la elección de su oponente. Este tipo de situaciones se modelan en teoría de juegos mediante los juegos de coordinación y anticoordinación. En particular, en los juegos de coordinación los dos jugadores obtienen el mayor beneficio cuando eligen la misma acción. El juego de la caza del ciervo (que se obtiene mediante una reordenación de las recompensas del dilema del prisionero) constituye un ejemplo paradigmático de juego de coordinación. En la caza del ciervo, los dos jugadores obtienen mayores recompensas cuando ambos eligen cooperar que cuando ambos eligen no hacerlo. A pesar de ello, hay dos equilibrios Nash, que corresponden a las combinaciones en las que ambos jugadores eligen la misma acción con probabilidad igual a uno. Considerando que las dos estrategias puras son equilibrios Nash y que la cooperación mutua proporciona mayores beneficios que la no cooperación mutua, ¿es más racional elegir cooperar que no cooperar? Aún sin considerar más aspectos, la respuesta no es obvia. Pero el problema es más complicado, ya que la cooperación implica más riesgos que la no cooperación. Esto se debe a que, en el caso de que las acciones de ambos jugadores no coincidan, el jugador que coopera recibe la menor recompensa posible. Lo que nos lleva a la siguiente cuestión, supongamos una lotería en la que el beneficio esperado es mayor que el coste de apostar, ¿un jugador racional apostará independientemente de otras variables? En otras palabras, ¿cómo de correlacionadas están la aversión al riesgo y la racionalidad? En una futura entrada de este blog trataremos la relación entre aversión al riesgo y cooperación.

Anuncios

Autor: Carlos Gracia

Researcher at the Institute for Biocomputation and Physics of Complex Systems (BIFI), Universidad de Zaragoza, Spain.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s