dominio paralelo proporciona a sus clientes la capacidad de generar conjuntos de datos sintéticos. La startup con sede en San Francisco ha lanzado una nueva API llamada laboratorio de datos que se apoya en los hombros de los gigantes de la inteligencia artificial generativa, dando a los ingenieros de aprendizaje automático control sobre mundos virtuales dinámicos para simular cualquier escenario imaginable.
“Todo lo que tiene que hacer es ir a GitHub, instalar la API y luego puede comenzar a escribir el código Python que genera conjuntos de datos”, dijo a TechCrunch Kevin McNamara, fundador y director ejecutivo de Parallel Domain.
Data Lab permite a los ingenieros generar objetos que antes no estaban disponibles en la biblioteca de recursos de la startup. La API utiliza la simulación 3D para proporcionar una base sobre la cual un ingeniero, a través de una serie de indicaciones simples, puede superponer el mundo real en toda su aleatoriedad. ¿Quieres entrenar a tu modelo para que conduzca por autopista con un taxi volcado en dos carriles? Fácil. ¿Crees que tu robotaxi debería saber cómo reconocer a un humano con un traje de dinosaurio inflable? Hecho.
El objetivo es dar a las empresas de autonomía, drones y robótica más control y eficiencia en la construcción de big data para que puedan entrenar sus modelos más rápido y a un nivel más profundo.
“El tiempo de iteración ahora se reduce básicamente a la rapidez con la que un ingeniero de ML puede pensar en lo que quiere y traducirlo en una llamada API, un conjunto de código”. dijo McNamara. “Hay un nivel casi infinito e ilimitado de cosas que el cliente puede escribir en el aviso, y el sistema simplemente funciona”.
Parallel Domain cuenta como clientes con los principales OEM que desarrollan sistemas avanzados de asistencia al conductor (ADAS) y empresas de conducción autónoma. En el pasado, una startup podía tardar semanas o meses en crear conjuntos de datos basados en parámetros específicos del cliente. Según McNamara, con la API de autoservicio, los clientes pueden crear nuevos conjuntos de datos “casi en tiempo real”.
A mayor escala, Data Lab puede ayudar a escalar los sistemas de conducción autónoma aún más rápido. McNamara dijo que la startup probó algunos modelos AV en conjuntos de datos de carros sintéticos contra conjuntos de datos de carros reales y descubrió que el modelo funcionaba mejor cuando se entrenaba en conjuntos de datos sintéticos.
Si bien Domain Parallel no utiliza ninguna de las API de IA de código abierto que han ganado popularidad en los últimos meses, como ChatGPT, la startup construye sus componentes tecnológicos sobre grandes modelos centrales que han sido de código abierto en los últimos años.
“Cosas como Stable Diffusion nos permiten ajustar nuestras propias versiones de estos modelos básicos y luego usar la entrada de texto para impulsar la generación de imágenes y contenido”, dijo McNamara, y señaló que su equipo desarrolló pilas de tecnología personalizadas para etiquetar objetos a medida que se generan. .
Parallel Domain lanzó inicialmente su motor de generación de datos sintéticos, llamado Reactor, en mayo para uso interno y pruebas beta con clientes de confianza. Ahora que Reactor se ofrece a los clientes a través de la API de Data Lab, es probable que el modelo comercial de Parallel Domain cambie, ya que los clientes prefieren un acceso fácil a la IA generativa.
La estrategia comercial de la startup en la actualidad es que los clientes compren asignaciones de datos y luego usen esos créditos durante todo el año. Data Lab puede ayudar a Parallel Domain a hacer la transición a un modelo de software como servicio (SaaS) donde los clientes pueden suscribirse para acceder a la plataforma y pagar según la frecuencia con la que la usan, dijo McNamara.
La API también puede ayudar a escalar un dominio paralelo en cualquier espacio donde la tecnología habilitada para la visión por computadora mejore la productividad de industrias como la agricultura, el comercio minorista o la fabricación.
“La incorporación de IA en la agricultura se considera una de las cosas más importantes que mejorarán la productividad, y queremos seguir estos casos de uso y, en última instancia, tener una plataforma en la que, sin importar en qué campo opere, si necesita entrenar una IA para ver el mundo con algún sensor, comience con el dominio paralelo”, dijo McNamara.