DeepMind afirma haber desarrollado un modelo de IA llamado RoboCat que puede realizar una variedad de tareas en diferentes modelos de brazos robóticos. Esto en sí no es particularmente innovador. Pero DeepMind dice que el modelo es el primero que puede resolver y adaptarse a múltiples tareas utilizando una variedad de robots del mundo real.
“Demostramos que un solo modelo grande puede resolver un conjunto diverso de tareas en muchos robots del mundo real y puede adaptarse rápidamente a nuevas tareas y realizaciones”, dijo Alex Lee, investigador de DeepMind y cocreador del equipo detrás de RoboCat. TechCrunch en una entrevista por correo electrónico.
RoboCat, inspirado en Gato, un modelo de IA de DeepMind que puede analizar y actuar sobre texto, imágenes y eventos, se entrenó con imágenes y datos de acción recopilados de robótica tanto en simulación como en la vida real. Los datos, dice Lee, provienen de una combinación de otros modelos que controlan robots en entornos virtuales, humanos que controlan los robots e iteraciones anteriores del propio RoboCat.
Para entrenar a RoboCat, los investigadores de DeepMind primero recolectaron entre 100 y 1000 demostraciones de una tarea o robot usando un brazo robótico controlado por humanos. (Imagine un brazo robótico recogiendo engranajes o apilando bloques). Luego ajustaron RoboCat para la tarea, creando un modelo “derivado” especializado que practicó la tarea un promedio de 10 000 veces.
Utilizando datos generados por modelos derivados y datos de demostración, los investigadores ampliaron continuamente el conjunto de datos de entrenamiento de RoboCat y entrenaron nuevas versiones de RoboCat.
La versión final del modelo RoboCat se entrenó en un total de 253 tareas y se comparó con un conjunto de 141 variaciones de estas tareas, tanto en la simulación como en el mundo real. DeepMind afirma que después de ver 1000 demostraciones controladas por humanos reunidas en cuestión de horas, RoboCat aprendió a operar varios robots.
Si bien RoboCat fue entrenado en cuatro tipos de robots de doble brazo, el modelo pudo adaptarse a un brazo más complejo con una pinza de tres dedos y el doble de entradas controladas.
Para evitar que RoboCat sea declarado el objetivo final de los modelos de IA que controlan robots, su tasa de éxito en varias tareas varió drásticamente en las pruebas de DeepMind: del 13 % en un nivel bajo al 99 % en un nivel alto. Eso es de 1000 demostraciones en datos de entrenamiento; los éxitos fueron predeciblemente menos comunes con la mitad de las demostraciones.
A pesar de esto, en algunos escenarios, DeepMind afirma que RoboCat pudo aprender nuevas tareas con solo 100 demostraciones.
En el futuro, Lee cree que RoboCat podría presagiar la reducción de la barrera para resolver nuevas tareas en robótica.
“Suministrado con un número limitado de demostraciones para una nueva tarea, RoboCat puede ajustarse para nuevas tareas y, a su vez, autogenerar más datos para mejorarlo aún más”, agregó.
En el futuro, el equipo de investigación tiene como objetivo reducir a menos de 10 la cantidad de demostraciones necesarias para enseñar a RoboCat a realizar una nueva tarea.