Profundice en el flujo de trabajo de LlamaIndex: arquitectura LLM basada en eventos | de Peng Qian | diciembre de 2024

Progresos y deficiencias después de la práctica.

Profundice en los flujos de trabajo de LlamaIndex: arquitectura LLM basada en eventos.
Profundice en los flujos de trabajo de LlamaIndex: arquitectura LLM basada en eventos. Imagen de DALL-E-3

Recientemente, LlamaIndex introdujo una nueva característica llamada Flujo de trabajo en una de sus versiones, que proporciona capacidades de desacoplamiento lógico y basadas en eventos para aplicaciones LLM.

En el artículo de hoy, profundizaremos en esta característica a través de un miniproyecto práctico, explorando las novedades y las carencias. Empecemos.

Cada vez más aplicaciones LLM están cambiando hacia arquitecturas de agentes inteligentes, esperando que los LLM satisfagan las solicitudes de los usuarios mediante llamadas a diferentes API o múltiples llamadas iterativas.

Sin embargo, este cambio trae consigo un problema: a medida que las aplicaciones de agentes realizan más llamadas API, las respuestas del programa se ralentizan y la lógica del código se vuelve más compleja.

Un ejemplo típico es ReactAgenteque implica pasos como Pensamiento, Acción, Observación y Respuesta Final, que requieren al menos tres llamadas de LLM y una llamada de herramientas. Si se necesitan bucles, habrá aún más llamadas de E/S.

Un agente típico de ReAct realizará al menos tres llamadas a LLM.
Un agente típico de ReAct realizará al menos tres llamadas a LLM. Imagen por autor