Los investigadores de IA han creado un bot de Minecraft que puede explorar y expandir sus posibilidades en el mundo abierto del juego, pero a diferencia de otros bots, este básicamente escribió su propio código a través de prueba y error y Mucho Consultas GPT-4.
Apodado Voyager, este sistema experimental es un ejemplo de un “agente encarnado”, una inteligencia artificial que puede moverse y actuar libremente y con un propósito en un entorno simulado o del mundo real. La IA tipo asistente personal y los chatbots no necesitan hacer cosas, y mucho menos navegar en un mundo complejo para hacerlo. Pero eso es exactamente lo que esperaría de un robot doméstico en el futuro, por lo que hay mucha investigación sobre cómo podrían hacerlo.
Minecraft es un buen lugar para probar cosas como esta porque es una representación muy (muy) aproximada del mundo real, con reglas y física simples y directas, pero también es lo suficientemente complejo y abierto como para que haya mucho que hacer o probar. . Los simuladores especialmente diseñados también son geniales, pero tienen sus propias limitaciones.
mi dojo es una plataforma de simulación construida alrededor de minecraft porque no puedes simplemente poner una IA aleatoria allí y esperar que entienda lo que están haciendo todos esos bloques y cerdos. Sus creadores (muy superpuestos con el equipo de Voyager) recopilaron videos de YouTube sobre el juego, transcripciones, artículos de wiki y toneladas de publicaciones de Reddit zr/minecraft, entre otros datos, para que los usuarios puedan crear o ajustar el juego basado en IA. en ellos. También te permite evaluar estos modelos de manera más o menos objetiva observando qué tan bien hacen cosas como construir una cerca alrededor de una llama o encontrar y extraer un diamante.
Viajero sobresale en estas tareas, con un desempeño significativamente mejor que el único otro modelo que se le acerca, Auto-GPT. Pero tienen un enfoque similar: usan GPT-4 para escribir su propio código sobre la marcha.
Normalmente, solo entrenaría al modelo con todos los buenos datos de Minecraft y esperaría que aprenda a luchar contra los esqueletos a medida que se pone el sol. Sin embargo, Voyager comienza siendo relativamente ingenuo y, a medida que encuentra cosas en el juego, tiene una pequeña conversación interna con GPT-4 sobre lo que debe hacer y cómo.
Por ejemplo, cae la noche y salen estos esqueletos. El agente tiene una idea general de esto, pero se pregunta: ¿Qué haría un buen jugador de este juego cuando hay monstruos alrededor? Bueno, GPT-4 dice que si quieres explorar el mundo de manera segura, querrás hacer y equipar una espada y luego golpear un esqueleto con ella mientras evitas ser golpeado. Y ese sentido general de lo que hay que hacer se traduce en objetivos específicos: recoger piedra y madera, construir una espada en la mesa de trabajo, equiparla y luchar contra el esqueleto.
Una vez hecho esto, se ingresan en la biblioteca general de habilidades para que más tarde, cuando la misión sea “profundizar en la cueva para encontrar mineral de hierro”, no tengas que aprender a pelear nuevamente. Todavía está usando GPT, pero está usando el GPT-3.5 más barato y rápido, que le dice qué habilidades son las más apropiadas para la situación, por lo que no está tratando de extraer esqueleto y luchar contra el mineral.
Es similar a un agente como Auto-GPT que, ante una interfaz que aún no conoce, debe aprender a navegarla para lograr su objetivo. Pero Minecraft es un entorno mucho más profundo de lo que está acostumbrado, por lo que un agente especial como Voyager lo hace mucho mejor. Encuentra más cosas, aprende más habilidades y explora un área mucho más grande que otros bots.
Curiosamente, pero quizás no sea sorprendente, GPT-4 limpia el piso de GPT-3.5 (es decir, ChatGPT) cuando se trata de generar código utilizable. La prueba de cambiar el primero por el segundo hizo que el agente chocara contra la pared antes de tiempo, quizás incluso literalmente, y no mejoró. Al hablar con estos dos modelos, puede que no sea obvio que uno es mucho más inteligente, pero la verdad es que no tienes que ser particularmente inteligente para tener una conversación aparentemente inteligente (pregúntame cómo lo sé). La codificación es mucho más difícil y GPT-4 fue una gran mejora allí.
El objetivo de esta investigación no es dejar obsoletos a los jugadores de Minecraft, sino encontrar métodos mediante los cuales los modelos de IA relativamente simples puedan mejorar en función de sus “experiencias”, a falta de una palabra mejor. Si vamos a tener robots que nos ayuden en nuestros hogares, hospitales y oficinas, deberán aprender y aplicar estas lecciones en actividades futuras.