Un amante de los gatos desconocido comentó una vez: “Los gatos y las computadoras tienen una cosa en común: ambos gobiernan Internet”.
En Google DeepMind, los investigadores combinaron recientemente la IA con un robot llamado RoboCat, y aunque todavía no gobierna Internet, se espera que dé un gran salto hacia el futuro mundo de los autómatas de autoaprendizaje.
Usando la misma tecnología detrás de modelos de lenguaje grandes, el equipo de DeepMind de más de 30 investigadores dijo que había logrado un gran avance en la forma de un gato robot que no solo aprende nuevas tareas rápidamente, sino que también puede mejorar su rendimiento al construir sus propios datos sobre el rendimiento. .
“RoboCat tiene un ciclo de entrenamiento virtuoso”, dijo DeepMind en un artículo publicado en el servidor de preimpresión. arXiv. “Cuantas más tareas nuevas aprenda, mejor aprenderá tareas nuevas adicionales”.
Hasta ahora, los robots generalmente han realizado tareas específicas y programadas. Con la introducción de grandes modelos de lenguaje, los conjuntos de habilidades de los robots comenzaron a expandirse, aunque el entrenamiento con grandes cantidades de datos requería una gran cantidad de tiempo.
Sin embargo, DeepMind dijo que Robocat puede aprender rápidamente nuevas tareas, como unir piezas de rompecabezas de diferentes formas en los agujeros correctos o colocar frutas en un tazón. Luego pudo evolucionar y realizar tareas más complejas “basadas en un conjunto de datos de millones de trayectorias” de tareas anteriores y nuevos datos autogenerados.
“Estas mejoras se debieron a la creciente amplitud de la experiencia de RoboCat, al igual que los humanos desarrollan una gama más diversa de habilidades a medida que profundizan su aprendizaje en un dominio determinado”, dijeron los investigadores.
A medida que RoboCat mejoró su técnica, sus nuevos comportamientos aprendidos se transfirieron a otros robots, que a su vez desarrollaron estas habilidades.
El robot perfeccionó su desempeño en entre 100 y 1000 demostraciones de un brazo robótico controlado por humanos. Luego, los modelos derivados fueron capacitados en tareas específicas, y estos datos se incorporaron a un conjunto general de instrucciones.
Si bien RoboCat inicialmente logró una tasa de éxito del 36 % en la resolución de tareas que no había aprendido antes, mejoró su desempeño con el tiempo. Gracias a la autoeducación, la tasa de éxito se ha duplicado.
“RoboCat aprende mucho más rápido que otros modelos de última generación”, dijeron los investigadores de DeepMind. “Puede realizar una nueva tarea con solo 100 demostraciones porque utiliza un conjunto de datos grande y diverso”.
El desarrollo se considera un paso importante hacia la aceleración de la investigación en robótica “ya que reduce la necesidad de capacitación supervisada por humanos y es un paso importante hacia la creación de un robot de propósito general”.
El artículo “RoboCat: agente central de automejora para la manipulación de robots” se publicó el 20 de junio.
¿Tales robots eventualmente eliminarán la necesidad de intervención humana?
Esta pregunta se planteó hace 100 años en la obra de teatro de 1921 “RUR: Rossum’s Universal Robots”, una historia del escritor checo Karel Čapek.
El programa presentó una fábrica que creaba humanoides sintéticos que trabajaban continuamente y, en última instancia, reducían los costos laborales en un 80 %. La palabra “robot” se usó en esta obra por primera vez, después de la palabra checa “robota”, que significaba “trabajo forzado de siervos”.
Finalmente, los robots se rebelaron y aniquilaron a la humanidad.
RoboCats, podemos esperar, será más amigable.
Aunque también hay que recordar lo que dijo una vez el humorista Will Rogers: “Dejar que el gato salga de la bolsa es mucho más fácil que volver a meterlo”.
Más información:
Konstantinos Bousmalis et al., RoboCat: una línea de base de autoperfeccionamiento para manipular robots, arXiv (2023). DOI: 10.48550/arxiv.2306.11706
Mente profunda: www.deepmind.com/blog/robocat-… errante-robot-agente
© 2023 Ciencia X Red