
Fuente: Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT
Si ve un automóvil autónomo en la naturaleza, puede notar un cilindro giratorio gigante en la parte superior de su techo. Es un sensor lidar que envía pulsos de luz infrarroja y mide el tiempo necesario para rebotar en los objetos. Esto crea un mapa de puntos en 3D que sirve como instantánea de los alrededores del automóvil.
La desventaja del LIDAR es que sus datos 3D son enormes y computacionalmente intensivos. Por ejemplo, un sensor típico de 64 canales produce más de 2 millones de puntos por segundo. Debido a la dimensión espacial adicional, los modelos 3D de última generación requieren 14 veces más cálculos en inferencia que sus contrapartes 2D. Esto significa que para navegar de manera eficiente, los ingenieros generalmente necesitan pasar los datos a 2D primero; el efecto secundario es que causa una pérdida significativa de información.
Pero el equipo del MIT está trabajando en el sistema autónomo que utiliza aprendizaje automático por lo tanto, la afinación manual personalizada es innecesaria. Su nueva plataforma integral puede navegar de forma autónoma utilizando solo datos de nubes de puntos 3D sin procesar y mapas GPS de baja resolución, similares a los disponibles actualmente en los teléfonos inteligentes.
El aprendizaje de extremo a extremo a partir de datos LIDAR sin procesar es un proceso computacionalmente intensivo, ya que implica entregar enormes cantidades de información sensorial rica a la computadora para aprender a conducir. Por esta razón, el equipo tuvo que diseñar nuevos componentes de aprendizaje profundo que hicieran un uso más eficiente del hardware GPU moderno para el control de vehículos en tiempo real.
“Optimizamos nuestra solución desde la perspectiva del algoritmo y del sistema, logrando una aceleración total de alrededor de 9 veces en comparación con los enfoques LIDAR 3D existentes”, dice Assoc. estudiante Zhijian Liu, coautor de este artículo junto a Alexander Amini.
En las pruebas, los científicos demostraron que su sistema reducía la frecuencia con la que el conductor humano tomaba el control de la máquina e incluso era capaz de soportar fallas graves en los sensores.
Por ejemplo, imagina conducir a través de un túnel y luego salir a la luz del sol; por una fracción de segundo, es probable que tus ojos tengan problemas para ver debido al resplandor. Un problema similar surge con las cámaras de los coches autónomos, así como con los sensores lidar de los sistemas cuando las condiciones meteorológicas son adversas.
Para hacer frente a esto, el sistema MIT puede estimar el grado de certeza de una predicción dada y, por lo tanto, puede dar a esa predicción más o menos peso al tomar una decisión. (Si sale del túnel, esencialmente ignoraría cualquier predicción en la que no se deba confiar debido a datos inexactos del sensor).
El equipo llama a su enfoque “fusión de pruebas híbridas”, ya que combinan diferentes predicciones de dirección para llegar a opciones de planificación del tráfico.
“Al fusionar los pronósticos de control en línea con la incertidumbre del modelo, el sistema puede adaptarse a eventos inesperados”, dice la profesora del MIT Daniela Rus, una de las autoras principales del artículo.
En muchos sentidos, el sistema en sí es una fusión de tres proyectos anteriores del MIT:
- MapLite, plataforma de conducción ajustada a mano sin mapas 3D de alta definición
- “Navegación diversificada de un extremo a otro”, un sistema de aprendizaje automático que se entrena a partir de los datos de conducción de las personas para aprender a navegar desde cero
- SPVNAS, una potente solución de aprendizaje profundo en 3D que optimiza su arquitectura neuronal y biblioteca de inferencias
“Aprovechamos las ventajas de un enfoque de conducción sin mapas y las combinamos con el aprendizaje automático de un extremo a otro, por lo que no necesitamos programadores experimentados para ajustar manualmente el sistema”, dice Amini.
En el siguiente paso, el equipo planea escalar aún más su sistema para aumentar la complejidad del mundo real, incluidas las condiciones climáticas adversas y la interacción dinámica con otros vehículos.
Navegación de extremo a extremo eficiente y robusta basada en LiDAR, arXiv: 2105.09932v1 [cs.RO] arxiv.org/abs/2105.09932
Entregado por
Instituto de Tecnología de Massachusetts