Los científicos del grupo AMOLF Soft Robotic Matter han demostrado que un grupo de robots pequeños, autónomos y de autoaprendizaje pueden adaptarse fácilmente a circunstancias cambiantes. Conectaron estos simples robots en una línea, después de lo cual cada robot individual aprendió a avanzar lo más rápido posible. Los resultados se publicaron hoy en una revista científica. PNAS.
Los robots son dispositivos brillantes que pueden hacer mucho. Hay robots que pueden bailar y subir escaleras, así como enjambres de drones que pueden volar solos en formación, solo por nombrar algunos. Sin embargo, todos estos robots están programados en gran medida: se han plantado diferentes situaciones o patrones en su cerebro de antemano, se controlan de forma centralizada o una red informática compleja les enseña a comportarse a través del aprendizaje automático. Bas Overvelde, investigador principal del grupo Soft Robotic Matter en AMOLF, quería volver a lo básico: un robot de autoaprendizaje lo más simple posible. “En última instancia, queremos poder utilizar sistemas de autoaprendizaje hechos de bloques de construcción simples que, por ejemplo, consisten completamente en un material como el polímero. También los llamaríamos materiales robóticos “.
Los científicos han logrado obtener carros robóticos interconectados muy simples que corren a lo largo de la pista para descubrir cómo pueden moverse lo más rápido posible en una dirección determinada. Los carros hicieron esto sin programar una ruta o sin saber qué estaban haciendo otros carros robóticos. “Es una nueva forma de pensar en el diseño de robots de autoaprendizaje. A diferencia de la mayoría de los robots programados tradicionales, este tipo de robot de autoaprendizaje simple no requiere ningún modelo complicado para permitirle adaptarse a un entorno que cambia rápidamente ”. explica Overvelde. “En el futuro, esto podría aplicarse a la robótica blanda, como los robots que aprenden a recoger objetos o los robots que ajustan automáticamente su comportamiento cuando se dañan”.
Robots respirables
El sistema de autoaprendizaje consta de varios bloques de varios centímetros de tamaño, es decir, robots individuales, conectados entre sí. Estos robots constan de un microcontrolador (minicomputadora), un sensor de movimiento, una bomba que bombea aire al fuelle y una aguja que deja salir el aire. Esta combinación permite que el robot respire. Si conecta el segundo robot con los fuelles del primer robot, se repelen entre sí. Esto es lo que hace posible el movimiento de todo el tren robótico. “Queríamos que los robots fueran lo más simples posible, por lo que elegimos fuelles y aire. Muchos robots blandos utilizan este método “, dice el Dr. estudiante Luuk van Laake.
Lo único que hacen los investigadores con anticipación es darle a cada robot un conjunto simple de reglas con unas pocas líneas de código de computadora (algoritmo corto): encender y apagar la bomba cada pocos segundos, esto se llama ciclo, luego tratar de moverse en una determinada dirección lo más rápido posible. Un chip en el robot mide continuamente la velocidad. Cada pocos ciclos, el robot realiza pequeños ajustes en el par de arranque de la bomba y determina si estos ajustes están provocando que el tren del robot avance más rápido. Es por eso que cada carro robótico realiza constantemente pequeños experimentos.
Si deja que dos o más robots se empujen y tiren entre sí de esta manera, el tren se moverá en una dirección tarde o temprano. Como resultado, los robots aprenden que esta es una mejor alineación para su bomba, sin necesidad de comunicación y sin programación precisa de movimiento hacia adelante. El sistema se está optimizando lentamente. Los videos publicados con el artículo muestran cómo el tren avanza lenta pero seguramente por una vía circular.
Hacer frente a nuevas situaciones
Los investigadores utilizaron dos versiones diferentes del algoritmo para ver cuál funcionaba mejor. El primer algoritmo registra las mejores medidas de velocidad del robot y las utiliza para determinar el mejor ajuste de la bomba. El segundo algoritmo usa solo la última medición de velocidad para determinar el mejor momento para encender la bomba en cada ciclo. El último algoritmo funcionó mucho mejor. Puede lidiar con situaciones sin tener que programarlas primero porque no pierde tiempo en comportamientos que pueden haber funcionado bien en el pasado pero que ya no funcionan en una nueva situación. Por ejemplo, puede superar rápidamente un obstáculo en una trayectoria mientras los robots programados con un algoritmo diferente se han detenido. “Si puede encontrar el algoritmo correcto, este sistema simple es muy confiable”, dice Overvelde. “Puede lidiar con una serie de situaciones inesperadas”.
Tirando de la pierna
No importa cuán simples sean, los científicos creen que los robots han cobrado vida. En uno de los experimentos, querían dañar robot para ver cómo se recupera todo el sistema. “Hemos quitado la aguja que funciona como una boquilla. Fue un poco raro. Como si le estuviéramos arrancando la pierna “. Los robots también adaptaron su comportamiento en caso de esta mutilación para que el tren comenzara a moverse en la dirección correcta nuevamente. Esta fue otra prueba de la solidez del sistema.
El sistema es fácil de expandir; Los investigadores ya han producido un tren en movimiento de siete robots. El siguiente paso es construir robots que se comporten de formas más complejas. “Un ejemplo de ello es la estructura similar a un pulpo”, dice Overvelde. “Es interesante ver si los ladrillos individuales se comportan como los brazos de un pulpo. Estos también tienen uno descentralizado. sistema nervioso, una especie de cerebro independiente, como nuestro sistema robótico.
Giorgio Oliveri el al., “Aprendizaje continuo de comportamientos emergentes en materia robótica”, PNAS (2021). www.pnas.org/cgi/doi/10.1073/pnas.2017015118