Entrene a los robots para que aprendan y tomen decisiones sobre la marcha

por el Departamento de la Universidad de Illinois. de Ingeniería Aeroespacial

Entrene a los robots para que aprendan y tomen decisiones sobre la marcha

El modelo de proceso gaussiano profundo propuesto se entrena en una base de datos de metaaprendizaje profundo fuera de línea con brechas de implementación controladas que divide repetidamente el conjunto de entrenamiento en entrenamiento promedio y entrenamiento del kernel, y aprende los parámetros del kernel para minimizar los residuos de los modelos promedio. Durante la implementación, el tomador de decisiones utiliza el modelo entrenado y lo adapta a los datos obtenidos en línea. Fuente: Departamento de Ingeniería Aeronáutica de la Universidad de Illinois

Los rovers de Marte tienen equipos de expertos humanos en la Tierra que les dicen qué hacer. Pero las misiones de aterrizaje robótico a las lunas que orbitan Saturno o Júpiter están demasiado lejos para recibir órdenes oportunas de la Tierra.

Investigadores de los Departamentos de Ingeniería Aeronáutica y Ciencias de la Computación de la Universidad de Illinois Urbana-Champaign han desarrollado un método novedoso basado en el aprendizaje que permite a los robots en cuerpos extraterrestres decidir de forma independiente dónde y cómo tomar muestras del terreno.

“En lugar de simular cómo recolectar todo tipo posible de roca o material granular, hemos creado una nueva forma para que los módulos de aterrizaje autónomos aprendan cómo aprender rápidamente a recolectar material nuevo que encuentren”, dijo el Dr. Pranay Thangeda. estudiante de la Facultad de Ingeniería Aeronáutica.

“También aprende a adaptarse a los paisajes cambiantes y sus propiedades, como la topología y la composición del material”, dijo.

Usando este método, Thangeda dijo que el robot podría aprender a recolectar material nuevo con muy pocos intentos. “Si hace algunos intentos fallidos, aprenderá que no debe meterse en esa área y lo intentará en otra parte”.

Uno de los desafíos para esta investigación es la falta de conocimiento sobre mundos oceánicos como Europa.

“Cuando enviamos los últimos rovers a Marte, los orbitadores nos dieron información bastante buena sobre las características del terreno”, dijo Thangeda. “Pero la mejor imagen de Europa que tenemos tiene una resolución de 256 a 340 metros por píxel, que no es lo suficientemente clara para determinar las características”.

El asesor de Thangeda, Melkior Ornik, dijo: “Todo lo que sabemos es que la superficie de Europa es hielo, pero pueden ser grandes bloques de hielo o mucho más finos como la nieve. Tampoco sabemos qué hay debajo del hielo”.

Para algunas pruebas, el equipo ocultó el material debajo de una capa de otra cosa. El robot solo ve el material superior y cree que vale la pena recogerlo. “Cuando realmente se levanta y golpea la capa inferior, descubre que no se puede levantar y se mueve a otra área”, dijo Thangeda.

Entrene a los robots para que aprendan y tomen decisiones sobre la marcha

A partir de estos 12 materiales y terrenos creados a partir de una composición única de uno o más materiales, se creó la base de datos 6700. Fuente: Departamento de Ingeniería Aeronáutica de la Universidad de Illinois

La NASA quiere enviar rovers alimentados por baterías en lugar de nucleares a Europa porque, entre otras consideraciones relacionadas con la misión, es crucial minimizar el riesgo de contaminar los mundos oceánicos con materiales potencialmente peligrosos.

“Aunque los suministros de energía nuclear tienen una vida útil de meses, las baterías tienen una vida útil de unos 20 días. No podemos permitirnos perder varias horas al día enviando mensajes de un lado a otro. Esta es otra razón por la cual la autonomía del robot en la toma de decisiones es esencial en sí misma”, dijo Thangeda.

Este método de aprendizaje también es único en el sentido de que permite que el robot use la visión y muy poca experiencia en línea para lograr acciones de recogida de alta calidad en un terreno desconocido, muy superior a los métodos no adaptativos y otros metaaprendizajes de última generación. métodos.

El equipo usó el robot en el Departamento de Tecnología de la Información de Illinois. Está modelado en un brazo de aterrizaje con sensores para recopilar datos sobre una variedad de materiales, desde granos de arena de 1 mm hasta rocas de 8 cm, así como materiales de varios volúmenes, como cartón triturado y paquetes de maní. La base de datos resultante en la simulación contiene 100 puntos de conocimiento para cada uno de los 67 terrenos diferentes, para un total de 6700 puntos.

“Hasta donde sabemos, somos los primeros en poner a disposición un conjunto de datos a gran escala en medios granulares”, dijo Thangeda. “También proporcionamos un código para acceder fácilmente al conjunto de datos para que otros pudieran comenzar a usarlo en sus aplicaciones”.

El modelo creado por el equipo se implementará en el Ocean World Lander Autonomy Testbed perteneciente al Jet Propulsion Laboratory de la NASA.

“Estamos interesados ​​en desarrollar las capacidades de los robots autónomos en superficies extraterrestres y, en particular, en superficies extraterrestres exigentes”, dijo Ornik. “Este método único ayudará a mantener a la NASA informada sobre su continuo interés en explorar mundos oceánicos”.

“El valor de este trabajo radica en la capacidad de adaptar y transferir conocimientos o métodos de la Tierra a un cuerpo extraterrestre, porque está claro que no tendremos mucha información antes de que el módulo de aterrizaje llegue allí. Y debido a la corta duración de la batería, no tendremos mucho tiempo para el proceso de aprendizaje. Un módulo de aterrizaje solo puede operar durante unos días y luego morir, por lo que el autoaprendizaje y la toma de decisiones son extremadamente beneficiosos.

Más información:
Yifan Zhu et al., Adaptación de varias tomas para manipular materiales granulares bajo cambio de dominio, Robótica: Ciencia y Sistemas XIX (2023). DOI: 10.15607/RSS.2023.XIX.048 www.roboticsproceedings.org/rss19/p048.html

Conjunto de datos de código abierto: drillaway.github.io/scooping-dataset.html.

Proporcionado por el Departamento de Ingeniería Aeronáutica de la Universidad de Illinois

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *