videojuego

videojuego

Fuente: Unsplash/CC0 Dominio público

Las personas toman muchas decisiones irracionales de manera predecible, pero ¿y si todos hacemos lo mejor que podemos dentro de nuestras posibilidades?

Los científicos han podido simular el comportamiento humano utilizando un autómata finito probabilístico, un modelo bien conocido con un poder computacional limitado. Programaron los autómatas para competir entre sí en la caza furtiva de animales salvajes, como un cazador furtivo de rinocerontes o un justiciero que intenta detener la caza furtiva.

Cuando las máquinas recordaron todo, determinaron la estrategia óptima para el juego. Pero cuando los investigadores limitaron su memoria, tomaron algunas decisiones rápidas, al igual que las personas reales que juegan el juego.

Este nuevo trabajo apoya la idea de la racionalidad limitada de que “a veces hacemos cosas estúpidas o cometemos errores sistémicos, no porque seamos irracionales, sino porque tenemos recursos limitados”, dijo el primer autor Xinming Liu ’20. “A menudo no podemos recordar todo lo que sucedió en el pasado, o no tenemos suficiente tiempo para tomar una decisión completamente racional”.

Liu presentó el artículo “Juego de estrategia de agentes con recursos limitados en juegos de seguridad” en mayo en la Conferencia internacional sobre agentes autónomos y sistemas multiagente de 2023. El autor principal es Joseph Halpern, profesor de informática en el Cornell Ann S. Bowers College. de Computación y Ciencias de la Información.

Hay varios lugares en el juego de la caza furtiva, cada uno con una probabilidad diferente de presencia de rinocerontes. En cada ronda, el cazador furtivo y el rastreador eligen un lugar para visitar y toman decisiones basadas en datos de rondas anteriores. El cazador furtivo gana puntos por atrapar un rinoceronte; el guardabosques gana puntos al atrapar al cazador furtivo.

Si el cazador furtivo y el cazador memorizan todos los movimientos del juego, pronto alcanzarán un equilibrio de Nash: un par de estrategias racionales e inmutables. Pero si las máquinas tienen una memoria más limitada, por lo que no pueden recordar dónde vieron ese rinoceronte 10, 100 o 1000 rondas atrás, toman decisiones humanas aparentemente irracionales.

Un comportamiento humano que imitaron los autómatas fue la coincidencia de probabilidades. Esto ocurre cuando una persona adivina los resultados de un lanzamiento de moneda cuando se pesa la moneda para que salga cara tres de cuatro veces. En lugar de adivinar siempre cara, lo que daría una tasa de éxito del 75 %, mucha gente acertó tres cuartas partes de las veces, lo que reduciría su tasa de éxito a alrededor del 63 %.

En el juego, esto significa que el cazador furtivo visitó lugares donde los rinocerontes eran más comunes en el pasado y lugares menos visitados donde los rinocerontes eran raros. Para las máquinas tragamonedas, esta estrategia no fue perfecta, pero aun así produjo resultados decentes.

Otro comportamiento humano irracional que condujo a buenos resultados en los juegos fue la prevalencia de resultados significativos, un fenómeno en el que los eventos importantes o traumáticos son particularmente memorables. Por ejemplo, una persona puede conducir lentamente en un tramo de carretera donde recibió una multa por exceso de velocidad hace muchos años.

Cuando los científicos programaron a los cazadores furtivos para sobrecargar los encuentros previos con el cazador, valió la pena en el juego. Terminaron evitando los lugares donde probablemente se alojaban los guardias.

Para ver cómo se comparan estos resultados con personas reales, Liu reclutó a unas 100 personas para jugar como cazador furtivo en una plataforma en línea. Mientras que algunas personas eligieron el mismo sitio cada vez o al azar para completar el juego y recibir el pago, otras eligieron sitios basándose únicamente en la coincidencia de probabilidades. El tercer grupo asumió que el rastreador se correspondía con las probabilidades y visitó lugares en consecuencia para evitar al rastreador.

Las similitudes en el juego entre humanos y autómatas muestran que el modelo puede replicar al menos dos comportamientos humanos que, en lugar de ser irracionales, en realidad mejoraron su desempeño.

“Otra forma de interpretarlo es decir que estás haciendo lo mejor que puedes dadas las limitaciones computacionales”, dijo Halpern. “Y eso me parece bastante razonable”.

Más información:
Xinming Liu et al., El juego de estrategia de agentes con recursos limitados en juegos de seguridad, Congreso Internacional de Agentes Autónomos y Sistemas Multiagente ’23 (2023). DOI: 10.5555/3545946.3598973 , dl.acm.org/doi/10.5555/3545946.3598973

Proporcionado por la Universidad de Cornell


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *