El otoño pasado, después de jugar con el modelo de IA de generación de texto GPT-3 de OpenAI, el predecesor de GPT-4, el exinvestigador de Uber Jerry Liu descubrió lo que describe como “limitaciones” en la capacidad del modelo para trabajar con datos privados (por ejemplo, archivos personales). . Para resolver este problema, lanzó un proyecto de código abierto, LlamaIndexdiseñado para desbloquear las capacidades y los casos de uso de modelos de lenguaje grande (LLM) como GPT-3 y GPT-4.
“Los LLM ofrecen oportunidades increíbles para la extracción de conocimiento y el razonamiento: pueden responder preguntas, resumir y extraer información e incluso tomar decisiones secuenciales en un entorno externo”, dijo Liu a TechCrunch en una entrevista por correo electrónico. “Pero los LLM tienen limitaciones”.
A medida que el proyecto creció en popularidad (hasta 200 000 descargas mensuales), Liu se asoció con Simon Suo, uno de sus antiguos colegas de Uber, para convertir LlamaIndex en una empresa de pleno derecho. Actualmente, LlamaIndex (empresa) ofrece un marco para ayudar a los desarrolladores a aprovechar las oportunidades de LLM en función de sus datos personales u organizacionales.
“Índice de llamas [helps] los desarrolladores administran sus datos para aplicaciones LLM”, dijo Liu. “Nuestro conjunto de herramientas tiene la mayor profundidad en este aspecto y facilitamos la integración con otras herramientas utilizadas por los desarrolladores”.
La plataforma LlamaIndex permite a los desarrolladores conectar datos de archivos como PDF, PowerPoint, aplicaciones como Notion y Slack, y bases de datos como Postgres y MongoDB a LLM. El marco incluye conectores para obtener fuentes de datos y formatos de datos, así como formas de estructurar los datos para que puedan usarse fácilmente con LLM.
Además, LlamaIndex incluye una interfaz de consulta y recuperación de datos que permite a los desarrolladores ingresar indicaciones de entrada LLM arbitrarias para obtener lo que Liu describe como salida “aumentada con contexto y conocimiento”.
“Existen otros marcos de aplicación de LLM que ofrecen los componentes básicos de las aplicaciones y los agentes de LLM”, dijo Liu. “Lo que es único de LlamaIndex es que nos enfocamos en conectar sus fuentes de datos a su LLM y tenemos herramientas extensivas de extracción de datos, administración de datos e indexación y recuperación de datos para su aplicación LLM”.
La perspectiva de expandir el LLM atrajo a inversionistas que prometieron $ 8.5 millones a LlamaIndex en una ronda de financiación inicial recientemente cerrada. Greylock corrió con ángeles de negocios, incluidos Jack Altman, Lenny Rachitsky y Charles Xie.
Entonces, ¿en qué gastará el dinero LlamaIndex? Liu dice que se usará para construir una “solución empresarial” además del proyecto de código abierto LlamaIndex, que se lanzará más adelante este año. Una función permitirá a los clientes usar conectores de datos de “grado de seguridad” para analizar y transferir grandes cantidades de datos, mientras que otra función relacionada les permitirá indexar datos “específicos del dominio”.
“LlamaIndex no está vinculado a una tecnología específica, por lo que podemos continuar usando LLM a medida que se desarrolla la tecnología”, dijo Liu. “La industria de la IA está creciendo tan rápido que cualquier acumulación inicial que surja probablemente cambiará en los próximos meses”.