Recientemente, LlamaIndex introdujo una nueva característica llamada Flujo de trabajo en una de sus versiones, que proporciona capacidades de desacoplamiento lógico y basadas en eventos para aplicaciones LLM.
En el artículo de hoy, profundizaremos en esta característica a través de un miniproyecto práctico, explorando las novedades y las carencias. Empecemos.
Cada vez más aplicaciones LLM están cambiando hacia arquitecturas de agentes inteligentes, esperando que los LLM satisfagan las solicitudes de los usuarios mediante llamadas a diferentes API o múltiples llamadas iterativas.
Sin embargo, este cambio trae consigo un problema: a medida que las aplicaciones de agentes realizan más llamadas API, las respuestas del programa se ralentizan y la lógica del código se vuelve más compleja.
Un ejemplo típico es ReactAgenteque implica pasos como Pensamiento, Acción, Observación y Respuesta Final, que requieren al menos tres llamadas de LLM y una llamada de herramientas. Si se necesitan bucles, habrá aún más llamadas de E/S.