El nuevo conjunto de datos de chef lleva la IA a la cocina

El nuevo conjunto de datos de chef lleva la IA a la cocina

Fragmento de conversación de una tarea de diálogo de instrucciones de cocina con buenas y malas respuestas del sistema y el tipo de error correspondiente de cada mala respuesta. Préstamo: arXiv (2023). DOI: 10.48550/arxiv.2305.17280

La inteligencia artificial (IA) puede ayudar a las personas a comprar, planificar y escribir, pero no a cocinar. Resulta que no solo las personas tienen dificultades para seguir las leyes paso a paso en el orden correcto, sino que una nueva investigación de la Facultad de Computación del Instituto de Tecnología de Georgia puede cambiar eso.

Los investigadores crearon un conjunto de datos llamado ChattyChef que utiliza modelos de procesamiento de lenguaje natural que pueden ayudar a un usuario a preparar una receta. Utilizando el modelo abierto del gran lenguaje GPT-J, el conjunto de datos del diálogo de cocina de ChattyChef sigue las recetas con el usuario.

Los investigadores mostraron su IA en el artículo “Pedido de instrucciones mejorado en conversaciones basadas en recetas”, presentado en 61ª Reunión Anual Association for Computational Linguistics, y el estudio también se publica en el sitio arXiv servidor de preimpresión

Mientras que otros investigadores han teorizado sobre las capacidades del jefe de IA, el trabajo de Georgia Tech está impulsando el campo. “Somos uno de los primeros equipos de investigación en explorar los desafíos de usar modelos de lenguaje grandes para construir un chef de IA”, dijo el Dr. Duong Le. estudiante de la Escuela de Computación Interactiva.

La mayoría de los intentos de usar modelos de lenguaje para cocinar fallan porque GPT-J no entiende lo que el usuario quiere hacer a continuación o la intención del usuario, y tiene dificultades para hacer un seguimiento de qué tan lejos está el usuario en la receta, lo que los investigadores llaman el “Estado parlante.” No, también puede responder fácilmente preguntas aclaratorias como la cantidad de ingredientes o el tiempo de cocción.

Por ejemplo, tal vez alguien esté tratando de cocinar un panqueque de papa. La IA les dice que derritan la mantequilla en la sartén y agreguen las papas. El usuario luego pregunta por el siguiente paso. Un robot malvado podría equivocarse en el pedido y decirles que sirvan la tortita de patata aunque todavía no la hayan cocinado. O el usuario hace una pregunta adicional sobre cuánto tiempo cocinar el panqueque de papa y la IA no será lo suficientemente precisa, sino que le dará un tiempo total y no especificará el tiempo de cocción para cada lado.

Con esto en mente, los investigadores se aseguraron de que su modelo tuviera dos características clave:

  • Detección de la intención del usuario para determinar la intención actual del usuario dentro de un conjunto fijo de capacidades, como “Preguntar por la siguiente instrucción” o “Solicitar información detallada sobre los ingredientes”.
  • Seguimiento de declaraciones para determinar dónde se encuentra el usuario en la receta, que funciona con un 80 % de precisión.

La información combinada de estas funciones respalda la tercera innovación de ChattyChef, la generación de respuestas. La intención del usuario ayuda a generar la mejor respuesta a la pregunta del usuario. El estado de las instrucciones selecciona las partes más relevantes de la receta en lugar de incluir la receta completa para evitar confundir al usuario o cargarlo con pasos adicionales al cocinar.

El conjunto de datos de ChattyChef se basa en recetas de WikiHow con calificaciones positivas y menos de ocho pasos. Los investigadores desafiaron a las personas a representar cómo usarían ChattyChef para determinar qué instrucciones se colocaron mejor en el conjunto de datos.

Los investigadores creen que las innovaciones de ChattyChef se pueden usar en muchas áreas fuera de la cocina, como manuales de reparación o documentación de software.

Más información:
Duong Minh Le et al., Orden mejorado de instrucciones en conversaciones basadas en recetas, arXiv (2023). DOI: 10.48550/arxiv.2305.17280

Sobre el diario:
arXiv


Proporcionado por el Instituto de Tecnología de Georgia


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *